作者weareyoung (weareyoung)
看板Master_D
标题[请益] 样本问题
时间Thu Nov 5 15:38:20 2015
ABC三个学生跑资料库抓精神疾病
A的总样本是全部的人50几万,有精神疾病的人是44%
B总样本数没A多但应该有几十万,精神疾病41%
(老师说差不多)
C总样本是A的样本中撷取有职业伤害的人,样本数三万多,精神疾病20几%而已。
会差那麽多是因为总样本人数C比较少的关系吗?还是跟总样本无关,是比例问题?
也就是说C虽然3万多人但应该也要跟A,B一样是40几%
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 101.139.157.218
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Master_D/M.1446709102.A.D4C.html
1F:→ blence: 在考虑是不是也40%之前,已经排除职业伤害的影响了吗 11/05 16:11
2F:→ milk0925: 以下说明只是我个人浅见,略供参酌。 11/06 15:05
3F:→ milk0925: 假如A和B皆是用近乎随机取样的方式进行抽样(毕竟现实上 11/06 15:06
4F:→ milk0925: 是很难做到完美的随机取样),那麽接下来我会想到的是, 11/06 15:08
5F:→ milk0925: C多设定了一个条件:「有职业伤害的人」,我不知道C是怎 11/06 15:11
6F:→ milk0925: 麽定义这个职业伤害的,因为"通常"如果疾病状况比较严重 11/06 15:12
7F:→ milk0925: 的话,可能也因此在工作的部分会有一些困难,意思也就是 11/06 15:15
8F:→ milk0925: 在临床上通常他们比较少是有工作的,所以当C多设定了 11/06 15:17
9F:→ milk0925: 「有职业伤害的人」这个条件时,可能就有机会把一部份确 11/06 15:18
10F:→ milk0925: 诊,而且相对状况比较严重的病人筛选掉了。 11/06 15:19
11F:→ milk0925: 因此我会疑惑的是,C的「有职业伤害的人」这个条件,是 11/06 15:22
12F:→ milk0925: 不是也同时代表着这些人在抽样当时是有工作的? 11/06 15:23