作者PPierce (小瑞)
看板SENIORHIGH
標題Re: 請問標準差分母的n和相關係數分母的n?
時間Fri Jun 24 18:30:12 2005
※ 引述《orzy (cat)》之銘言:
: 請問
: 標準差的公式裏 (公式有點難打,公式有錯,包含
: 一下子囉!)
: 我怎麼有時看到書寫的分母是n
: 有時看到書寫的分母是n-1呢?
: 是怎麼一回事呢?那個對呢?
: 都對嗎?還是要視情況而定呢?怎麼判斷取捨呢?
用推文回太慢我直接回文
一般來說你看到的資料是母體的話就是用 n
資料是樣本的話就是用 n-1
題目如果沒特別聲明,請使用樣本的分母除數 n-1
除非題目有說以下幾筆是xxxxxx的"全部"資料
就是說他有強調這些資料就已經是全部了
那這時在使用分母 n
其實n,n-1這數字是一種自由度(degrees of freedom,DF),統計上假設n筆資料就有n個自由度
當在做分析時,你每用一個參數估計,就會損失一個自由度
如今妳用樣本標準差s去估計母體標準差sigma,自由度就會少一變成n-1
以後上大學你可能還會學到用有超過一個參數去估計的
這時分母還有可能變成n-f (f代表是幾個變數用估計的)
: 又
: 在相關係數的公式裏
: 有時也會看到書寫的分母是n,
: 有時看到書寫的分母是n-1呢?
: 是怎麼一回事呢?那個對呢?
: 都對嗎?還是要視情況而定呢?怎麼判斷取捨呢?
: 標準差的n和相關係數的n 兩者在計算時有沒有關連性呢?
相關係數一般是取一部分樣本,來做回歸分析的估計
(如果都有母體的資料的話也沒什麼好估計的)
所以如同標準差一樣 題目沒聲明,就是用樣本的自由度n-1 (分母)
除非題目提到這些是所有的資料
再來,相關係數的公式可以看成
ˍ ˍ
Xi- X Yi- Y
------‧-----
Σ( Sx Sy )
r = ------------------ 其中Sx=(Sxx/n-1)開根號 <=其實就是X樣本(n-1)的標準差啦
N-1 Sy=(Syy/n-1)開根號 抱歉不會打開根號Orz
ˍ
而其中 Xi- X / Sx 就是X的標準化分數 (Z-score)
也就是說 Xi(某個觀察值)距離X bar(X的平均值) 有幾個標準差(除以Sx)的意思
假設 X 平均5 Sx = 10 則有一筆資料X1 = 20 的標準化分數就是
20-5 / 10 = 1.5 就是說這筆資料X1離平均有1.5個標準差的距離
ˍ
然後 Yi - Y /Sy 就是Y的標準化分數,意義同X
假設 Y平均 20 Sy =5 則一筆 Y1 = 25 的標準化分數就是1
所以總的來說 相關係數r 根據上述的公式
可以看成
兩個變數(x,y)他們分別標準化分數的乘積 例如第一筆X和Y的標準化分數乘積
就是剛剛算的 1.5 X 1 = 1.5
然後再把每一筆對應的標準化分數乘積加總(1~n有幾筆就加幾筆)
所以結論是相關係數可以看成 兩變數標準化分數乘積 的平均數
(因為加總後除以n-1,相當於平均數的意思)
這是相關係數跟標準差之間的關係
所以你標準差分母用什麼係數 相關係數底下的分母就用什麼係數
就統計學而言 一般資料都是樣本啦
(都有母體的資料就沒什麼好做估計分析以及應用了)
當然考試故意設計的題目有可能是母體資料
就看題目怎麼說 沒特別聲明 就代表他是用樣本資料
對這個有興趣的話
可以來唸統計系........(逃)
你會被操到想不懂也難.....
: 也就是說當標準差拿分母是n的公式來計算時,
: 相關係數也要拿分母是n的公式來計算嗎?
: 兩者有無關連性呢?
: 標準差分母的n和相關係數分母的n,在計算時
: 到底要怎麼來判斷取捨呢?(什麼時候用n,什麼時候用n-1呢?)
: 有沒有明確的說法和正確的用法呢?
: 可否請各位高手教導一下子呢?
: 先謝謝啦!
--
http://www.wretch.twbbs.org/album/ppierce
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.116.131.225
※ 編輯: PPierce 來自: 140.116.131.225 (06/24 18:39)
1F:推 Andyhsu:推~~~~~~(這篇文章值352銀) 218.172.153.23 06/24