作者celestialgod (攸蓝)
看板Statistics
标题Re: [问题]偏离问题
时间Sun Aug 2 16:43:02 2015
※ 引述《chenfafa (fafa)》之铭言:
: 如果是跟统计软体有关请重发文章。
: 如果跟论文有关也烦请您重发文章。
: 请详述问题内容,以利板友帮忙解答,过短文章依板规处置,请注意。
: http://i.imgur.com/UGLc09A.jpg
: 不好意思
: 想问这上面的图
: 为什麽median一定在mean跟mode中间?
: 还有可以解释为什麽左偏的平均数会在最左边?反之亦然
: 有用假设一次考试大家都考很好去想
: 但还是不太能理解这三者间的关系
: 我有查一些网站了
: 但都没有讲的很清楚
: 谢谢大家~
: http://i.imgur.com/4AaPpvb.jpg
: 还有这张图 感觉跟上面观念有点像
: 解说是用outlier去解释
: 但我还是有点不懂
: 再次谢谢大家
我自己教的时候是这样说明的,提供参考:
平均数会受极端值影响,
会出现右偏(right-skewed)的图形,比median小
反之,则是左偏(left-skewed),比median大
众数则是出现在出现次数最多的次数 (就density来看就是density最高的地方)
一个右偏的分配,众数会出现在较小的值,会比median小
反之,会出现在较大的值,会比median大
PS: median是比50%的资料大的值,所以右偏时,会出现在过最大density的地方
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 123.205.27.107
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1438504985.A.954.html
1F:推 chenfafa: 还是不太懂也 能再讲清楚mean的部分吗 谢谢08/02 16:58
2F:推 chenfafa: 但图上 右偏时 小的值叫多 平均值是比中、众数大08/02 18:51
3F:→ chenfafa: 平均值是较大08/02 18:51
4F:→ chenfafa: 跟你讲的不一样也08/02 18:51
抱歉,刚刚搞混,应该更正成,右偏时,有一些大的值就会把平均值拉大
5F:→ LiamIssac: 1 2 3的平均 跟1 2 19的平均08/02 20:09
6F:→ yhliu: 以前似乎我曾说明过这问题, 可能是贴在 成大计中站 吧? 现08/03 06:02
7F:→ yhliu: 在该站已关, 找不到了. orz08/03 06:03
8F:→ yhliu: 正偏, 又称 右偏, 是指右边尾巴拉得较长. 以中位数为准, 中08/03 06:04
9F:→ yhliu: 位数右边的资料被拉开(拉长), 也就是说, 相对於中位数左边 08/03 06:05
10F:→ yhliu: 有些资料离得比较远, 因此平均数被拉高. 反之, 中位数左边08/03 06:06
11F:→ yhliu: 挤在较小范围, 整个分布曲线被挤压, 所以高峰可能出现在中08/03 06:07
12F:→ yhliu: 位数左边. 也就是说, 呈现 众数 < 中位数 < 平均数 的样子.08/03 06:08
13F:→ yhliu: 负偏, 又称左偏, 则是相反乎, 中位数之左被拉长, 因而比较08/03 06:09
14F:→ yhliu: 少出现高峰; 而右边被挤压, 所以众数可能在中位数之右.08/03 06:10
15F:→ yhliu: 以上说明教本上对偏斜分布的一般描述, 中位数在众数与平均 08/03 06:11
16F:→ yhliu: 数中间. 不过, 这都只是 "典型". 如果套用某种特定分布, 可08/03 06:12
17F:→ yhliu: 能发现并不是这样的, 例如 Weibull 分布之 shape parameter08/03 06:20
18F:→ yhliu: 在某些范围时可能出现 median < mode < mean, 另某些范围时08/03 06:21
19F:→ yhliu: 可能出现 median < mean < mode. 请参见 08/03 06:22
20F:→ yhliu: telnet://bs2.twbbs.org 之 P_cjosephlu 版, "What about08/03 06:23
21F:→ yhliu: the skewness?" 讨论串.08/03 06:24
22F:→ yhliu: 第2张图, 很明显的正偏分布, 右边尾巴拉得较长, 并不需要有08/03 06:26
23F:→ yhliu: outlier 才能解释 mean > median.08/03 06:26
24F:→ yhliu: 事实上该图也没显示有无 outlier, 只是最简单的盒形图.08/03 06:28
谢谢老师详细的说明
我有到该站去看了相关讨论串
Weibull(λ,k)的mode, median, mean分别是:
mode: λ((k-1)/k)^(1/k)
mean: λG(1+1/k), G is gamma function
median: λ(ln(2))^(1/k)
假设λ=1,我们可以得到下图
http://i.imgur.com/6eov2N6.png
三条灰色虚线分别是 3.258921 3.312487 3.439541
而skewness在大於3.602345时,小於0
code:
http://pastebin.com/yDbnRmMs
PS: skewness都很小,在这种case下,看不太出来distribution是否真的左偏或右偏...
因此,median, mean, mode的大小顺序是"典型",但大多数情况是可以参考的
25F:推 goshfju: 推楼上~08/03 07:35
※ 编辑: celestialgod (123.205.27.107), 08/03/2015 09:58:55
26F:推 chenfafa: 谢谢大家.....真的很感谢 08/03 15:52
27F:推 chenfafa: 我第二张图本来是选D,是不清楚为什麽能知道平均值,没 08/03 15:54
28F:→ chenfafa: 有给个数有多少,想请问这是为什麽? 08/03 15:54
29F:→ celestialgod: 上面刘老师有说明喔 08/03 17:25