作者eegame (yu)
看板R_Language
标题[问题] 想用R写一个统计回归分析的程式
时间Fri Nov 20 14:24:02 2015
初学者(两个月) R是第一个程式语言
不知道各位前辈有没做过类似的程式
!!!假设!!!
想用R统计10条绳子的长度
再根据统计特性的率随机产生10组数据
程式如下
G <- 10 #10组数据
rowname <- c(1:G) #Y轴名称
colname <- c("c1","c2","c3","c4") #X轴名称
F <- matrix(,nrow=G,ncol=4,dimnames=list(rowname,colname))?
#开一个10*4的矩阵并以rowname和colname
F[1,"c1"] <- 19
F[2,"c1"] <- 59
F[3,"c1"] <- 48
F[4,"c1"] <- 23
F[5,"c1"] <- 31
F[6,"c1"] <- 48
F[7,"c1"] <- 56
F[8,"c1"] <- 60
F[9,"c1"] <- 74
F[10,"c1"] <- 83
#在矩阵c1的位置放入这10条绳子的调查数据
#假设1符合常态分布
F[,"c2"] <- rnorm(10,10,90)?
#在矩阵c2的位置放入根据常态分布的机率随机产生一组新的数据介於10~90之间的10笔数
据
#假设2符合均匀分布
F[,"c3"] <- dunif(10,10,90)
#在矩阵c3的位置放入根据均匀分布的机率随机产生一组新的数据介於10~90之间的10笔数
据
#假设3符合Poisson distribution分布
F[,"c4"] <- dpois(10, lambda=1)
#在矩阵c4的位置放入根据Poisson distribution分布的机率随机产生一组新的数据介於1
0~90之间的10笔数据
#结果如下
F
c1 c2 c3 c4
1? 19 -70.255568 0.0125 1.013777e-07
2? 59 9.346476 0.0125 1.013777e-07
3? 48? -2.139539 0.0125 1.013777e-07
4? 23 -33.231206 0.0125 1.013777e-07
5? 31? 72.630937 0.0125 1.013777e-07
6? 48? -6.032507 0.0125 1.013777e-07
7? 56? -8.420308 0.0125 1.013777e-07
8? 60 -69.542557 0.0125 1.013777e-07
9? 74? 12.044775 0.0125 1.013777e-07
10 83 -13.474063 0.0125 1.013777e-07
问题1.我函数的指令是不是给的不对导致c2 c3 c4的结果错误?
问题2.关於随机分布的应用 如何做到根据统计特性产生结果?
问题3.关於数据统计特性如何检定比较符合 常态分布 均匀分布 负指数分布等等的分布
特性? 是用卡方检定 T-test检定? 还是用数值回归???
这两个月没有看到类似的文章
麻烦各位前辈指点迷津
拜托 拜托
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.136.208.20
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1448000644.A.095.html
1F:→ celestialgod: 1. 你知道各分配参数意义吗?11/20 14:28
2F:→ celestialgod: 2. 你知道第一个问题就知道怎样根据你观察的资料11/20 14:28
3F:→ celestialgod: 去产生适当的随机数11/20 14:28
4F:→ celestialgod: 3. 你的目标是检定什麽?十条绳子长度符合某分配?11/20 14:29
5F:→ celestialgod: 4. 你学过适合度检定吗?11/20 14:30
6F:→ celestialgod: 另外,我很好奇这跟回归(标题)有什麽关系啊?11/20 14:36
7F:→ celestialgod: 5. 你产生随机数的目的是什麽?11/20 14:36
8F:→ celestialgod: 6. 会不会你等一下又要删文啦?11/20 14:39
不好意思我疑惑了 主要的目的是根据数据的分布特性 找出最适合的特性(常态 均匀 指
数 负指数)分布 接下来以最适合的特性分布 随机产生一组新的数据 目前知道要开矩阵
存数据 然後绘制直方图做各区间数量统计 根据数据的分布特性 找出最符合的特性分布
并以特性分布在每个区间的机率随机产生新的数据
※ 编辑: eegame (114.136.66.137), 11/20/2015 21:51:19
9F:→ allen1985: 所以你的问题跟回归没有关系?11/21 17:03
找出最合适的分布特性 我不知如何下手 因为逻辑判断好像没办法 感觉用回归曲线对找
各特性分布曲线 找最小平方差来决定出最合适的特性
这个想法不知道对不对
有没有办法写出来
※ 编辑: eegame (114.136.88.76), 11/21/2015 21:59:00
10F:→ allen1985: 最合适的分布特性? 你是说资料最符合哪种分配吗?11/22 09:36
11F:→ allen1985: 你问题中的自变数 应变数 是? 11/22 09:37
12F:→ allen1985: 建议你简化一下你的题目 一步一步问 从头开始 11/22 09:37
13F:→ allen1985: 大概知道你的问题是什麽了 你有听过qq-plot吗 11/22 09:39
是的 资料最符合的分配
之前有用ggplot2来试画极座标投影图
可是资料分布不是用直方图来画就可以了吗? qq-plot是要用在画图吗?还是有其他隐藏
版的功能???
※ 编辑: eegame (223.140.231.38), 11/22/2015 12:09:38
14F:→ allen1985: 对我来说 你用ggplot2 还是什麽function画图 不重要 11/22 12:12
15F:→ allen1985: 重要的是你想要画什麽图 你的图想表达什麽 11/22 12:13
16F:→ allen1985: qq-plot 是用来检测资料是否为常态分配的一种方法 11/22 12:13
17F:→ allen1985: 而你现在最欠缺的是 你得先把统计方法学好 11/22 12:13
18F:→ allen1985: 其次才是用R把结果写出来 11/22 12:14
19F:→ celestialgod: 推楼上,重点不是R,他只是工具,你怎麽呈现你的想 11/22 14:25
20F:→ celestialgod: 法才是重点 11/22 14:25