作者cool (無)
看板SENIORHIGH
標題Re: [問題] 標準差
時間Sun Jun 5 23:46:17 2005
※ 引述《sendohandy (11..歡樂世紀板!!)》之銘言:
: ※ 引述《utobia ()》之銘言:
: : 請問標準差的公式到底是什麼
: : 因為看課本跟參考書寫的不太一樣
: : 有的是除以n 有的是除以n-1
: : 迷惑阿...
--------------------------------------------------------------------------
在樣本數小的時候,是除以(n-1)。
在樣本數大的時候,除以n或除以(n-1)都可以。
先給定符號方便說明,假如母體變異數是C
樣本變異數有兩個公式,除以(n-1)的變異數當作A,除以n的變異數當作是B
A也是一個隨機變數,它的期望值剛好等於C
B也是隨機變數,但是它的期望值等於(n-1)/n*C
換言之,B不是估計C的最佳公式
但是,在樣本數很大(也就是n很大時),(n-1)/n會逼近於1,則(n-1)/n*C就逼近C了
所以,樣本夠大時,B也可以用。
--------------------------------------------------------------------------
至於為什麼是除以(n-1),原因是:
sigma(X-母體平均數)/C 是卡方分配,自由度為n
在μ未知時,以樣本平均數代替,樣本平均數與樣本是線性相依的,換句話說,
若知道樣本平均數,其中一個樣本可以用其他(n-1)個樣本和樣本平均數組合出來。
這也就是喪失一個自由度的意思。
sigma(X-樣本平均數)/C是卡方分配,自由度為n-1
卡方分配的期望值正好等於自由度
所以,sigma(X-樣本平均數)/C的期望值等於(n-1)
移項整理以後,sigma(X-樣本平均數)/(n-1)的期望值等於C
~~~~~~~~~~~~~~~~~~~~~~~~~正好就是A
所以A的期望值等於C
這就是除以(n-1)的原因。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 210.58.144.222
1F:推 sendohandy:感謝,不過學生聽的懂嗎?? 0rz221.169.163.121 06/05
2F:推 aether982:大樣本是超過多少才算呢? 218.160.33.144 06/06
3F:推 utobia:聽不懂 不過很佩服你@_@ 61.64.173.243 06/06
4F:推 cool:理論是超過30可以算大樣本,但實務上通常是超過100 210.58.144.222 06/06
5F:→ cool:才會算樣本數夠大。 210.58.144.222 06/06
6F:推 handicap:不夠嚴謹, 不過還算蠻ok的解釋 :) 61.62.100.48 06/06
7F:推 Ruka:chi-squared...提醒我該唸機率與統計的時候了... 140.113.124.83 06/06
8F:推 crazymars:怪步的學測給的是n的 因為是100筆資料吧 140.114.215.79 06/06
9F:→ lovehan:該不會是...大學的統計學? @@140.128.194.159 06/06
10F:推 hoyushen:用n-1的話才會是unbiased estimator 203.203.98.45 06/06
11F:推 pinkygiveme:這真的要講可以講一大篇吧 高中生不必知道 140.115.216.39 06/06
12F:→ pinkygiveme:我們老師當初也沒講 140.115.216.39 06/06