作者PPierce (小瑞)
看板SENIORHIGH
标题Re: 请问标准差分母的n和相关系数分母的n?
时间Fri Jun 24 18:30:12 2005
※ 引述《orzy (cat)》之铭言:
: 请问
: 标准差的公式里 (公式有点难打,公式有错,包含
: 一下子罗!)
: 我怎麽有时看到书写的分母是n
: 有时看到书写的分母是n-1呢?
: 是怎麽一回事呢?那个对呢?
: 都对吗?还是要视情况而定呢?怎麽判断取舍呢?
用推文回太慢我直接回文
一般来说你看到的资料是母体的话就是用 n
资料是样本的话就是用 n-1
题目如果没特别声明,请使用样本的分母除数 n-1
除非题目有说以下几笔是xxxxxx的"全部"资料
就是说他有强调这些资料就已经是全部了
那这时在使用分母 n
其实n,n-1这数字是一种自由度(degrees of freedom,DF),统计上假设n笔资料就有n个自由度
当在做分析时,你每用一个参数估计,就会损失一个自由度
如今你用样本标准差s去估计母体标准差sigma,自由度就会少一变成n-1
以後上大学你可能还会学到用有超过一个参数去估计的
这时分母还有可能变成n-f (f代表是几个变数用估计的)
: 又
: 在相关系数的公式里
: 有时也会看到书写的分母是n,
: 有时看到书写的分母是n-1呢?
: 是怎麽一回事呢?那个对呢?
: 都对吗?还是要视情况而定呢?怎麽判断取舍呢?
: 标准差的n和相关系数的n 两者在计算时有没有关连性呢?
相关系数一般是取一部分样本,来做回归分析的估计
(如果都有母体的资料的话也没什麽好估计的)
所以如同标准差一样 题目没声明,就是用样本的自由度n-1 (分母)
除非题目提到这些是所有的资料
再来,相关系数的公式可以看成
ˍ ˍ
Xi- X Yi- Y
------‧-----
Σ( Sx Sy )
r = ------------------ 其中Sx=(Sxx/n-1)开根号 <=其实就是X样本(n-1)的标准差啦
N-1 Sy=(Syy/n-1)开根号 抱歉不会打开根号Orz
ˍ
而其中 Xi- X / Sx 就是X的标准化分数 (Z-score)
也就是说 Xi(某个观察值)距离X bar(X的平均值) 有几个标准差(除以Sx)的意思
假设 X 平均5 Sx = 10 则有一笔资料X1 = 20 的标准化分数就是
20-5 / 10 = 1.5 就是说这笔资料X1离平均有1.5个标准差的距离
ˍ
然後 Yi - Y /Sy 就是Y的标准化分数,意义同X
假设 Y平均 20 Sy =5 则一笔 Y1 = 25 的标准化分数就是1
所以总的来说 相关系数r 根据上述的公式
可以看成
两个变数(x,y)他们分别标准化分数的乘积 例如第一笔X和Y的标准化分数乘积
就是刚刚算的 1.5 X 1 = 1.5
然後再把每一笔对应的标准化分数乘积加总(1~n有几笔就加几笔)
所以结论是相关系数可以看成 两变数标准化分数乘积 的平均数
(因为加总後除以n-1,相当於平均数的意思)
这是相关系数跟标准差之间的关系
所以你标准差分母用什麽系数 相关系数底下的分母就用什麽系数
就统计学而言 一般资料都是样本啦
(都有母体的资料就没什麽好做估计分析以及应用了)
当然考试故意设计的题目有可能是母体资料
就看题目怎麽说 没特别声明 就代表他是用样本资料
对这个有兴趣的话
可以来念统计系........(逃)
你会被操到想不懂也难.....
: 也就是说当标准差拿分母是n的公式来计算时,
: 相关系数也要拿分母是n的公式来计算吗?
: 两者有无关连性呢?
: 标准差分母的n和相关系数分母的n,在计算时
: 到底要怎麽来判断取舍呢?(什麽时候用n,什麽时候用n-1呢?)
: 有没有明确的说法和正确的用法呢?
: 可否请各位高手教导一下子呢?
: 先谢谢啦!
--
http://www.wretch.twbbs.org/album/ppierce
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.116.131.225
※ 编辑: PPierce 来自: 140.116.131.225 (06/24 18:39)
1F:推 Andyhsu:推~~~~~~(这篇文章值352银) 218.172.153.23 06/24