作者evilove (诚实是被选择的)
看板Geography
标题Re: [新闻]重新认识高雄学
时间Mon Dec 18 18:18:06 2006
※ 引述《biotite (山水寄情)》之铭言:
: 1. 问题涉及不少统计概念跟经验,请恕我不逐一回应。
: 若我没回应到的,版上应该有不少高手可以补充。
: 2. 样本数跟你如何测量当然有关。
: 举例来说,你可以容忍两单位的误差
: 当你用10的量尺和100的量尺,两单位的误差的概念是不一样的,後者样本数需较多
: 而统计比例的2选1(binomial)问法样本数算法也不一样
: 你提供的网站是算binomial 的
: 若母体总数很大的话,理论上样本数跟母体总数无关 如1万跟1000万样本数都一样
: 我不确定的是,他们要母体总数是否为了修正变异数所用(若母体数很小的话)
: 他们没揭露他们的运算式,资讯也不够明确,使用上还是得小心
: 另,FYI,该网页是个市调公司
这也是我困惑很久的地方
书上明明拿成功失败二项式样本的例子表示机率各50%
可是我读过论文中
没有一个人是根据你所说的量尺来决定抽样方法
包括大家推荐的洪老师
我最近也在思考为什麽会有这样的落差?
而且有些问卷包含的量尺很多元
那抽样不就>_<''
我上网找了一下
P代表的应该是事先知道母体比例下才能知道的
在不知道母体的比例我们通常取P=.50的情况下让样本的变异最大
所以是不是其实跟量尺无关呢?
只是我又很困惑
有些资料官方有~譬如性别可能50/50 年龄可能10/20/25/25/20
区域的资料也有其比例
那抽样时如果同时考量应该怎麽设P值?
又~问卷题项通常是未知的,又怎麽跟上述同时考量?
: 3. n >= 30 是个经验共识,就像为何讲95% CI 一样
: 当然,这是个可以接受的临界值,若只抽样30个,必须要有补充说明来合理化之
: 另,我没注意到你说的表,但我想是因为有这经验共识,表才会这麽制作
这个真的不是共识
管中闵老师的书开宗明义就提这个观念很多教科书都混淆
至於细节我已经提过是没有根据的
http://www.sinica.edu.tw/~ckuan/books.html
: 4. 各县市抽100个,最後可以用人口加权来再现全台的面貌
: 至於你说的抽样不均(1万抽1个或1000抽一个),在统计上没差,因为这是统计
我之前提过
事前可以控制抽到的机率相等会优於事後的加权
我提的方法是大家惯用的P.P.S
(probability proportional to size, P.P.S)
至於你说的这个概念我真的不懂
可以请你多说一些吗?
: 5. 就选举政党倾向而言,就县市讨论是有意义的,涉及空间问题
: 如各县市人口结构、产业结构、历史文化社会因素等
同意
不过我好奇的是里的13个怎麽被算出来的:P
A大赶快来解惑吧
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.138.153.240
※ 编辑: evilove 来自: 140.138.153.240 (12/18 20:17)
1F:推 aoishingo:这 要问TEDS... 还是我找找学长信箱 = = 12/19 00:15