作者cool (无)
看板SENIORHIGH
标题Re: [问题] 标准差
时间Sun Jun 5 23:46:17 2005
※ 引述《sendohandy (11..欢乐世纪板!!)》之铭言:
: ※ 引述《utobia ()》之铭言:
: : 请问标准差的公式到底是什麽
: : 因为看课本跟参考书写的不太一样
: : 有的是除以n 有的是除以n-1
: : 迷惑阿...
--------------------------------------------------------------------------
在样本数小的时候,是除以(n-1)。
在样本数大的时候,除以n或除以(n-1)都可以。
先给定符号方便说明,假如母体变异数是C
样本变异数有两个公式,除以(n-1)的变异数当作A,除以n的变异数当作是B
A也是一个随机变数,它的期望值刚好等於C
B也是随机变数,但是它的期望值等於(n-1)/n*C
换言之,B不是估计C的最佳公式
但是,在样本数很大(也就是n很大时),(n-1)/n会逼近於1,则(n-1)/n*C就逼近C了
所以,样本够大时,B也可以用。
--------------------------------------------------------------------------
至於为什麽是除以(n-1),原因是:
sigma(X-母体平均数)/C 是卡方分配,自由度为n
在μ未知时,以样本平均数代替,样本平均数与样本是线性相依的,换句话说,
若知道样本平均数,其中一个样本可以用其他(n-1)个样本和样本平均数组合出来。
这也就是丧失一个自由度的意思。
sigma(X-样本平均数)/C是卡方分配,自由度为n-1
卡方分配的期望值正好等於自由度
所以,sigma(X-样本平均数)/C的期望值等於(n-1)
移项整理以後,sigma(X-样本平均数)/(n-1)的期望值等於C
~~~~~~~~~~~~~~~~~~~~~~~~~正好就是A
所以A的期望值等於C
这就是除以(n-1)的原因。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 210.58.144.222
1F:推 sendohandy:感谢,不过学生听的懂吗?? 0rz221.169.163.121 06/05
2F:推 aether982:大样本是超过多少才算呢? 218.160.33.144 06/06
3F:推 utobia:听不懂 不过很佩服你@_@ 61.64.173.243 06/06
4F:推 cool:理论是超过30可以算大样本,但实务上通常是超过100 210.58.144.222 06/06
5F:→ cool:才会算样本数够大。 210.58.144.222 06/06
6F:推 handicap:不够严谨, 不过还算蛮ok的解释 :) 61.62.100.48 06/06
7F:推 Ruka:chi-squared...提醒我该念机率与统计的时候了... 140.113.124.83 06/06
8F:推 crazymars:怪步的学测给的是n的 因为是100笔资料吧 140.114.215.79 06/06
9F:→ lovehan:该不会是...大学的统计学? @@140.128.194.159 06/06
10F:推 hoyushen:用n-1的话才会是unbiased estimator 203.203.98.45 06/06
11F:推 pinkygiveme:这真的要讲可以讲一大篇吧 高中生不必知道 140.115.216.39 06/06
12F:→ pinkygiveme:我们老师当初也没讲 140.115.216.39 06/06