作者lisa090914 (好天气,好心情~)
看板Statistics
标题[问题] 样本平均数及变异数的抽样分配自由度?
时间Tue Dec 22 18:07:30 2015
最近念到样本平均数跟样本变异数的抽样分配
一直不太懂的是 为什麽当μ已知时 s^2的抽样分配的自由度是n 未知时是n-1
当μ已知 S^2 = 1/nΣ(Xi-μ)^2
当μ未知 S^2 = 1/(n-1)Σ(Xi-Xbar)^2
(Σi=1~n)
而当σ已知时 Xbar的抽样分配自由度也是n 未知时n-1
是因为未知的时候要用Xbar跟s来分别估计μ跟σ吗?
然後为什麽在σ未知的情况下 Xbar的抽样分配要换成用t统计量算呢?
感谢各位大大解惑了QQ m(_ _)m
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.117.71.162
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1450778852.A.BC8.html
1F:推 circlelee: 这样才会符合估计的不偏性 而且期望值=母群变异 12/22 19:42
2F:推 circlelee: 少一个自由度 抽样分配就会变的较不稳定 从常态变高狭 12/22 19:49
3F:→ celestialgod: 你是大一?还是大二以上?有学过数理统计学吗? 12/22 19:50
4F:→ circlelee: 板主 这应该可由数理统计的公式去证明吧? 12/22 19:51
6F:→ celestialgod: 他假设是常态,不过其实任意分布,期望值变异数存在 12/22 19:53
7F:→ celestialgod: 即可 12/22 19:54
8F:→ celestialgod: 这个证明,大一只需要稍微看过就好 12/22 19:54
9F:→ celestialgod: 学数统的话,要把前提记清楚,证明也要会 12/22 19:54
10F:→ celestialgod: 大二以上非统计的话,稍微看过即可 12/22 19:55
11F:→ celestialgod: 抽象一点,解释的话,你sample是在n维,mu unknown 12/22 19:56
12F:→ celestialgod: 下,你要先估计mu,会被占走一个维度, 12/22 19:57
13F:→ celestialgod: 由剩下n-1个维度去估计变异数 12/22 19:57
14F:→ celestialgod: 回circlelee大大,是在数统里证明没错 12/22 19:58
15F:→ celestialgod: 跟数统公式无关吧 12/22 19:58
16F:推 circlelee: 有种说法是 xbar被拿去估计母群的mu,为了让xbar固定 12/22 19:59
17F:→ circlelee: 自由抽样的个数 从n个 变成n-1 12/22 20:00
18F:→ circlelee: 板主: 我是指的是 常态分配的公式 推导成t分配的过程 12/22 20:00
19F:→ celestialgod: 常态推到t?? t分布应该是定义出来的吧XDDD 12/22 20:02
20F:推 circlelee: 常态等於t分配自由度无穷大,自由度愈大愈接近常态 12/22 20:04
21F:→ circlelee: 自由度愈小 则愈显高狭 所以我才想像t可由常态推导 12/22 20:05
22F:→ celestialgod: 那是t分配的特性 12/22 20:05
23F:→ circlelee: 不过理论上的东西 我就比较不懂 我推想而已 12/22 20:05
24F:→ celestialgod: t检定是被提出来,建议变异数未知下,使用它可以有 12/22 20:08
25F:→ celestialgod: 比较好的检定力 12/22 20:08
26F:→ celestialgod: 有兴趣可以比比看变异数未知下,z-test跟t-test的 12/22 20:09
27F:→ celestialgod: 检定力 12/22 20:09
28F:→ celestialgod: 还有型一误差 12/22 20:09
29F:→ celestialgod: 如果上述有错,再麻烦其他大大更正。 12/22 20:09
30F:→ celestialgod: 更正一件事情,t分配是mu unknown时,X bar的抽样 12/22 20:40
31F:→ celestialgod: 分配,应该是被推导出来的,上面说定义不合宜。 12/22 20:40
32F:推 circlelee: 推板主认真! 12/22 21:09
33F:推 goshfju: 可利用 Σ(Xi-μ)^2=Σ(Xi-μ)^2+n(Xbar-μ)^2 去看 12/22 22:45
34F:→ goshfju: Σ(Xi-μ)^2/σ^2=ΣZi^2为卡方(n)分配 12/22 22:46
35F:→ goshfju: n(Xbar-μ)^2=[(Xbar-μ)/(σ/√n)]^2=Z^2为卡方(1)分配 12/22 22:46
36F:→ goshfju: 故Q=Σ(Xi-Xbar)^2/σ^2=(n-1)S^2/σ^2为χ^2(n-1)分配 12/22 22:47
37F:→ goshfju: 由上面也可看出Σ(Xi-μ)^2自由度为n 12/22 22:48
38F:→ goshfju: μ被Xbar取代後 Σ(Xi-Xbar)^2 自由度成为n-1 12/22 22:48
39F:→ goshfju: 定义t=Z/√(Q/v) 为自由度v的t分配 12/22 22:50
40F:→ goshfju: 这里 Z=(Xbar-μ)/(σ/√n) , Q=(n-1)S^2/σ^2 , v=n-1 12/22 22:50
41F:→ goshfju: 都代进去後消一消就可得 t=(Xbar-μ)/(s/√n) 为自由度 12/22 22:51
42F:→ goshfju: n-1的t分配 12/22 22:51
43F:→ goshfju: 我推文第三行有漏 12/22 22:52
44F:→ goshfju: n(Xbar-μ)^2/σ^2=[(Xbar-μ)/(σ/√n)]^2 才对 12/22 22:53
45F:→ lisa090914: 感谢版主、circle大跟gosh大!!! 看到不偏性之後翻一下 12/22 23:55
46F:→ lisa090914: 书就大概懂了 第二个t分配那边是用推导出来的 是我一 12/22 23:57
47F:推 goshfju: 不偏性可解释为何样本变异数分母要除以n-1 12/22 23:58
48F:→ lisa090914: 开始没看懂 我再研究一下 12/22 23:58
49F:→ goshfju: 不过自由度会减一最主要还是因为用Xbar取代μ 12/22 23:58
50F:→ lisa090914: 想问一下circle大 自由度那边你说"为了让Xbar固定" 12/23 00:00
51F:→ lisa090914: 是要固定成什麽值阿? 12/23 00:01
52F:推 goshfju: 其实Σ(Xi-Xbar)^2/"n"也可当作样本变异数 12/23 00:01
53F:→ goshfju: 他也有蛮多好的性质 只是没有不偏性 而他自由度还是n-1 12/23 00:02
54F:→ lisa090914: gosh大 所以可以解释成 为了符合不偏性所以要除以n-1 12/23 00:03
55F:→ lisa090914: 吗? 其实还是不太懂为什麽是n-1@@ 有点抽象 12/23 00:04
56F:推 goshfju: 数学的结果 S^2=Σ(Xi-Xbar)^2/"n-1" 12/23 00:05
57F:→ goshfju: 才会有 E(S^2)=...(数学运算)...=σ^2 12/23 00:06
58F:→ lisa090914: 嗯...计算过程我懂 但要怎麽解释让他比较好记是我正 12/23 00:09
59F:→ lisa090914: 伤脑筋的地方ˊ^ˋ 12/23 00:09
60F:推 goshfju: 不偏性就是平均来说会中的意思 你可以看成在射标靶 12/23 00:10
61F:→ goshfju: 虽然不会每次正中红心 但平均来说是在红心的地方 12/23 00:10
62F:推 goshfju: 至於为什麽除以n-1会有不偏性 很难用直觉去想XD 12/23 00:12
63F:→ goshfju: 你可以找个例子验证 做出样本平均数的抽样分配 12/23 00:13
64F:→ goshfju: 会发现真的需要除以n-1 才会满足不偏性 12/23 00:14
65F:→ lisa090914: 刚刚上面circle大的"为了让固定Xbar"的说法我好像快懂 12/23 00:17
66F:→ lisa090914: 了可是还差一点XD 12/23 00:17
67F:推 circlelee: Xbar要假装成母群的mu 所以在抽样分配中 就不能动 12/23 10:27
68F:→ circlelee: 不能动的情况下,自由度就少了1个。 12/23 10:28
69F:→ circlelee: 比如 某三个数的平均数为10 前两个数自由抽取为14、9 12/23 10:28
70F:→ circlelee: 最後一个数 就不能动 一定要变成7 这样平均才会是10 12/23 10:29
71F:→ circlelee: 变异数的概念 也就是 离均差平方和 除以 自由度 12/23 10:31
73F:→ lisa090914: circle大 所以是因为Xbar要固定成某个值(但不一定是) 12/23 14:29
74F:→ lisa090914: 真正的mu) 所以要少一个自由度罗? 12/23 14:29
75F:→ circlelee: 不是某个值,就是要当成mu!mu的唯一估计值 12/23 17:05
76F:→ yhliu: 谈 "自由度" 完全可以不涉及 "不偏" 与否的问题. 可参考 12/24 08:41
77F:→ yhliu: telnet://bs2.to:443 Statistics 版 3→1→14 12/24 08:43
78F:→ yhliu: Xbar 若要谈自由度, 定的自由度是 1, 不是 n-1 也不是 n. 12/24 08:44
79F:→ lisa090914: 感谢yhlin大!!! 用离均差来解释就懂了!!! 太感谢了QQQ 12/26 19:42