作者milk0925 (牛奶刺蝟)
看板Statistics
标题[问题] "0"的影响力? (代po)
时间Sun Jan 24 17:38:18 2016
以下内容帮朋友代po ↓
------------------------------------------------
大家好~
有些统计上的问题我思考了许久仍不确定这样的想法是否正确,
因此想寻求大家的见解。
(文略长请见谅)
在我的研究中需要做到中介效果,
然而在检验中介效果之前必须符合些基本假设,
而我也已经做了检验确定其符合这些前提假设,
但是其中有些比较特别的状况让我有些疑惑,
这里说明以X为自变项,Y为依变项,M为中介变项,
我的Y值是用二元式量表计分而得,
亦即Y值是由每一题回答为「是」或「否」的题目组合而成,
而我在计分时将「是」计为1分,「否」计为0分,
最後所有题项加总的分数即为Y值。
我那个时候也很犹豫这样的状况我到底是应该要把Y视为类别变项吗?
但是由於它又不是只以一题作为分析,
而是以量表中每一题的回答加总做为总分,
所以我依旧将其视为连续变项进行分析,
而测量M值的量表是采用李克特氏量表进行计分,
问题是:
由於用来测量Y值的量表和用来测量M值的量表,
其组成的每一题题项回答数值皆以「0」为起始分,
亦即受试者有圈选0的可能,
而结果也发现有一部份受试者在Y和M的总分为0,
因为担心这样的情况会影响分析结果,
所以就把可能的预测配对结果都试跑看看,
亦即将测量Y值和M值的量表每一题修正为从「1」开始计值。
结果发现,
因为有部分的受试者在Y和M的得分都是0,
结果若两者都以原始方式计分(以0为起始分),
M对Y的解释力为14%,
但是若是以调整後的方式分析,
不论是M值从1开始、Y维持从0开始,
或是M和Y皆改为从1开始,
M对Y的解释力都只剩下4%,
但其效果皆达显着,
因此想说是不是两者皆为0的缘故导致调整後R^2严重膨胀?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.47.56.143
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1453628303.A.6E7.html
1F:推 evilove: you need to use logit reg 01/25 00:39
2F:→ andrew43: 怪怪的。平移和伸缩应该不会改变相关程度。 01/25 03:27
3F:→ andrew43: 你要不要检查一下你在改变分数的过程有没有出错? 01/25 03:28
4F:→ milk0925: andrew43大大你这麽一说我就有概念了(我对图型的理解力 01/25 13:17
5F:→ milk0925: 比较好~抱歉),我晚点再重新确认跑跑看,谢谢! 01/25 13:17
6F:→ milk0925: evilove大大,如果我用来测量Y的量表有加总分也要当它是 01/25 13:18
7F:→ milk0925: 类别吗? 01/25 13:18
8F:→ milk0925: 我重新确认後还是一样的结果TAT 01/25 16:34
9F:→ milk0925: 「原始M对原始Y」和「原始M对调整後的Y」其调整後R^2皆 01/25 16:36
10F:→ milk0925: 为14%,但「调整後M对调整後Y」和「调整後M对原始Y」皆 01/25 16:37
11F:→ milk0925: 降为4%。 01/25 16:37
12F:推 evilove: 看错,你要先看Y的分布再决定方法 01/25 23:16
13F:→ milk0925: 如果Y的母群违反常态的可能性很高,是不是需要换成无母 01/26 15:37
14F:→ milk0925: 数的回归方法才是正确的? 01/26 15:37
15F:→ yhliu: 不一定需要用无母数方法. 比较需要考虑的是加总得的分数是 01/27 16:29
16F:→ yhliu: 否确实有意义. 至於是用 0-1 去计分加铑, 或用 1-2 去计分 01/27 16:30
17F:→ yhliu: 加总, 或仍是0-1计分加总但总分再加 1, 结果应泗应响回归式 01/27 16:32
18F:→ yhliu: 的常数项. 01/27 16:32
19F:→ milk0925: 听到不一定要用无母数的方法觉得好感动喔~谢谢你们, 01/27 21:36
20F:→ milk0925: 至少让我心安了一下!因为这几天想说可能得认命点使用无 01/27 21:36
21F:→ milk0925: 母数的方法,尝试去了解後发现完全超出我的认知能力负 01/27 21:36
22F:→ milk0925: 荷范围,而且相对好像也比较少人去论述无母数的回归。 01/27 21:36
23F:→ milk0925: 不过不晓得方不方便再让我尝试澄清其中的资讯,因为我 01/27 21:56
24F:→ milk0925: 担心有些小地方我不小心误解了您的意思? 我的Y其实代 01/27 21:56
25F:→ milk0925: 表着是临床上若受试者勾选有出现量表中描述状况的几项, 01/27 21:56
26F:→ milk0925: 以反应其因疾病受影响的程度,所以即便结果总分是0,应 01/27 21:56
27F:→ milk0925: 该...在我的研究中是有意义的才是。这只是我自己的想法 01/27 21:56
28F:→ milk0925: ,也许不尽然是对的,如果有其它的观点我也很乐意听听 01/27 21:56
29F:→ milk0925: 看,也许会让我有机会发现自己的盲点:) 01/27 21:56
30F:→ milk0925: 所以我想了解的是,如果我设定的分数是有意义的前提之下 01/27 22:05
31F:→ milk0925: ,那麽即便我的Y并非呈常态分配的话(其实我一直再想虽然 01/27 22:05
32F:→ milk0925: 我的抽样样本约150份,呈现非统计学上常提的钟型常态, 01/27 22:06
33F:→ milk0925: 但我认为依据我想探究的现象,它其实母群几乎也不太可 01/27 22:06
34F:→ milk0925: 能是钟型常态,反而比较可能是呈现我搜集到的样本分布 01/27 22:09
35F:→ milk0925: 状态),也能够使用线性回归的关键原因为何? 01/27 22:09
36F:→ andrew43: 回到问题本身。我还是觉得平移不会造成此问题。 01/28 07:46
37F:→ andrew43: 所以我之前才会请你检查你资料是不是出错了。 01/28 07:47
38F:→ andrew43: 要不要把再多统计结果报表贴出来看看? 01/28 07:49
39F:→ milk0925: http: //ppt.cc/7j7gZ 01/28 11:17
40F:→ milk0925: 上面这个网址是我M和Y皆用原始值计算分析出来的结果,因 01/28 11:18
41F:→ milk0925: 为原始缩图网址被PTT系统判定为暂停使用,因此我在http: 01/28 11:19
42F:→ milk0925: 後方多增加了一个空格:) 01/28 11:19
43F:→ milk0925: http: //ppt.cc/PYHKg 此则为使用调整後数值的结果 01/28 11:23
44F:→ milk0925: 不知道图片中的资料是否足够判断问题所在? 01/28 11:24
45F:→ milk0925: 我刚刚找到问题所在了!因为有两个预设系统转换(调整)值 01/28 11:44
46F:→ milk0925: 整个跳掉,导致被判读成遗漏值,刚刚用人工补植的方式进 01/28 11:46
47F:→ milk0925: 行修正後再重跑一次就好了! 结果都是14%,是我太粗心了 01/28 11:46
48F:→ milk0925: 对不起 v v 想说奇怪怎麽样本数会不一样。 01/28 11:48
49F:→ milk0925: 不过我还是很想知道如果样本和母群皆未常态,那麽依旧可 01/28 11:51
50F:→ milk0925: 以使用linear regression的原因为何? 01/28 11:52
51F:→ andrew43: 不要用这个图床,题外话。 01/29 02:33
52F:→ andrew43: 一般线模的前题是残差独立且常态。看残差分配像不像常态 01/29 02:36
53F:→ andrew43: 看看。 01/29 02:36
54F:→ milk0925: 我有检测过residual plots,不论是原始资料或是尝试使用 01/29 11:48
55F:→ milk0925: 课本上提到可以用来治疗非常态的转换方式,像是平方根、 01/29 11:49
56F:→ milk0925: 立方、平方都试过,依旧无法使之成常态。 01/29 11:50