作者yhliu (老怪物)
看板Math
标题Re: [中学] 98学测「知名」题目,我想与前辈们研讨 …
时间Sun Jan 16 03:24:52 2011
※ 引述《alfadick (悟道修行者)》之铭言:
: 标题可能写得很奇怪 XDD 请见谅,为了吸引目光><
: 题目如下:
: 某厂商委托民调机构在甲、乙两地调查听过某项产品的居民占当地居民之百分比(以下简
: 称为「知名度」)。结果如下:在 95% 信心水准之下,该产品在甲、乙两地的知名度之信
: 赖区间分别为 [ 0.50 , 0.58 ]、[ 0.08 , 0.16 ]。试问下列哪些选项是正确的?
: (A) 甲地本次的参访者中, 54% 的人听过该产品
依常见的构造比例之信赖区间方法, 这是对的.
(就中学课程而言它大概是对的.)
不过, 事实上这不一定是对的.
: (B) 此次民调在乙地的参访人数少於在甲地的参访人数
如 (A).
: (C) 此次调查结果可解读为:甲地全体居民中有一半以上的人听过该产品的机率大於
: 95%
甲地居民是否有一半以上的人听过该产品, 是一个确定但
未知的事, 要论机率的话, 不是0就是1, 但天晓得! 若能
知道就不必再做抽样调查了.
根据信赖区间 [0.50, 0.58] 可以说
至少有95%信心说甲地至少有一半的人知道该产品.
但再重做一次抽样调查, 并不能保证95%水准的信赖区间,
其下限仍在0.50以上.
: (D) 若在乙地以同样方式进行多次民调,所得知名度有 95% 的机会落在区间[ 0.08 ,
: 0.16 ]
即使每次都抽同样大小的样本, 而且是几乎同时做的 (确
保群体未改变), 也难以说有95%,或近似95%的机会落在区
间 [0.08,0.16].
这叙述有不少错误.
: (E) 经密集广告宣传後,在乙地再次进行民调,并增加参访人数达原人数的四倍,则在
: 95% 信心水准之下该产品的知名度之信赖区间宽度会减半(即 0.04)
若没有 "经密集广告宣传後", 而是立即重新抽样,重新调
查, 那麽样本数增大为4倍, 信赖区间长度减半是对的.
然而, "经密集广告宣传後", 群体已经改变了, 群体比例
已改变 (广告即使不能增加买气, 至少会提高知名度.)
: Ans: A, B
: ===========================================================
: 翻阅数十本参考书,查阅好几本学测考题解析,而C选项说法五花八门千奇百怪
: 我熟读南一、全华课本之後,对於信心水准信赖区间的系统稍有掌握,
: 希望与正确的统计学概念互相契合
: (D)选项也是,但是我知道D选项为什麽不对,
: 我说说看我的想法,希望能得到大家共鸣,然後再把我对C的想法说出来
: D's Sol:
: 因为p hat 有95%的机率在p+-(2sigma)的区间中,我以'表示hat, #表sigma
: 也就是 p-2# <= p' <= p+2# (这个关系没什麽意义)
: 即 p-2# <= p' 且 p' <= p+2#
: 移项得 p<= p'+2# 且 p'-2# <=p
: 所以 p'-2# <= p <= p'+2# (这个式子的价值比较大)
: 哦!所以当我抽样得到p hat 时,真正的p有95%机率在区间p hat +- (2sigma)
当你已得到 p-hat, 就没有所谓 "机率" 的问题了!
当你有信赖区间[0.08, 0.16], p 是否在其中是确定但未
知的事.
"95%水准的信赖区间" 是说在对同一群体重复做抽样统计
结果, 有95%的机会所计算出来的 "信赖区间" 包含真 p.
此时所谈的 "机会"(机率), 是针对不同次抽样,随机的结
果,随机的区间.
而叙述 (D) 却在说 p-hat 会落在一固定区间的机率.
: 但是sigma = sqrt(p(1-p)/n) 其中p我们不知道,但可以p'(hat)来估计
: 所以p', 2#' 都有了,我们可以知道真正的p有95%在这区域里面,称为信赖区间
: 回到这个选项:
: [0.08,0.16]是这次的p hat加减两个sigma hat(以sigma hat估计sigma)
: 所以题目的叙述,就是在讲我说「没什麽意义」的那关系,
: 还没有到「後面」什麽移项那里,题目问的是一开始那个很基本的东西!
: 也就是题目所说做好几次抽样的p hat应该有95%机率落在
: [p-2#,p+2#] 才对,而这个p跟这个sigma都要上帝才能得到!
: ===================================================
: 但是C选项呢?
: (1)有人说不能用机率来讲,可是如果题目是要这样考你,他大可以讲=95%,
: 何必说大於呢? 她如果只是要考你这个能不能跟机率扯上关系,讲等於就好,
: 她之所以讲大於,一定是有什麽意义
: (2) 可是我认为是这样
: http://img4.imageshack.us/i/yosh.png/
: 在这p的常态分配中(正中间是p hat , 我已经移项了)
: p有95%机率在 [0.50,0.58] 但是常态分配+2#'的右边还有资料分布,
: 我的意思是,p界於0.5~0.58的机率是95%,可是0.58後面还有2.5%的分布
: 所以机率是大於95%,似乎也没错,应该是95+2.5=97.5% 左右才对
: 这样解释得通,看起来也没错,
: 请教各位先进前辈,希望有人能顺便帮我转统计版 。
: 谢谢大家耐心看完我的问题 :)
别想太多, 基本观念很简单:
"信赖水准" 与 "机率"(覆盖机率)当然是有关的. 更明确
地说, 信赖水准是依存於覆盖机率的. 而其细节:
(1) 一次特定调查结果(一个特定信赖区间)是不能谈机率
的. 因为, 所有的东西都是确定(但可能未知)的. 计
算出来的信赖区间(样本结果)是确定而已知的, 而群
体参数是确定而未知的.
(2) 机率是针对抽样的理论结果, 或无数次重复抽样的结
果在谈的. 因此, 能谈 "机率" 的 "信赖区间" 是随
机的区间.
(3) 信赖区间谈的是群体的未知参数会落在甚麽范围, 而
不是样本统计量(估讦量)或明确的样本值(估计值)会
落在哪里.
--
来自统计专业的召唤...
成大计中站 telnet://bbs.ncku.edu.tw Statistics (统计方法及学理讨论区)
盈月与繁星 telnet://ms.twbbs.org Statistics (统计:让数字说话)
交大资讯次世代 telnet://bs2.twbbs.org Statistics (统计与机率)
<<<>>> 把自己当成别人。把别人当成自己。把别人当成别人。把自己当成自己 <<<>>>
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 125.233.154.253
1F:推 haolihy :推 01/16 11:54
2F:→ qpzmm :推 01/16 18:59