作者jaids (做工的人)
看板DataScience
标题[问题] statistical modeling如何知道distributi
时间Tue Mar 21 17:40:13 2023
统计题目通常都是给定已知distribution
然後这之後由data估计出mean, variance等未知变量(data analysis)
我好奇如何能从一群data估计出是什麽distribution?
就是说statistical modeling是怎麽做的? 先感谢各位的回覆与建议了 谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 92.221.218.184 (挪威)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1679391616.A.837.html
1F:推 wtchen: 应该是先「假设」其distribution再去求相关参数吧 03/21 18:53
2F:推 yiche: 同一楼看法 03/21 20:14
3F:推 yiche: 看设的random variable情境为何,在不同情境有不同适用的 03/21 20:18
4F:→ yiche: 机率分布,至於准不准确我认为有待样本做大之後再检验了 03/21 20:18
5F:推 SilenceWFL: 承上述大大讨论:统计模型之所以是「统计」,是因为 03/22 00:47
6F:→ SilenceWFL: 基於研究者对这个领域的了解与前人经验的累积,才能 03/22 00:47
7F:→ SilenceWFL: 针对变数提出很强的分布假设,透过这样的假设才能进 03/22 00:47
8F:→ SilenceWFL: 一步推敲变数与应变数的关系 03/22 00:47
9F:→ SilenceWFL: 当然这时就会有人质疑,前人经验与当下情境有所出入 03/22 00:51
10F:→ SilenceWFL: ,究竟是否合适继续使用同样的分布假设;这时除了可 03/22 00:51
11F:→ SilenceWFL: 以透过检定佐证外,也可以透过各式各样的手段放宽分 03/22 00:51
12F:→ SilenceWFL: 布假设的限制(比方说robust, panel data… 03/22 00:51
13F:推 raiderho: 标准做法不就是 kernel density estimation 吗? 03/22 14:30
14F:推 carolian: 可以用Central limit theorem假设distribution 03/22 15:53
15F:推 bearching: 看你要做什麽用 如果是计量相关分析可以用GMM方法 只要 03/22 17:25
16F:→ bearching: 知道动差就可以跑了~回到问题本身 所以要先观察data阿 03/22 17:25
17F:→ bearching: 学这麽多分配就是要让你知道资料有这些种类的特性 都 03/22 17:26
18F:→ bearching: 不是那些学过的话再来谈 03/22 17:26
19F:推 wieldthewave: 推一楼 03/27 18:55
20F:→ wieldthewave: 比较「统计化」的执行方式应该是先猜测分布然後再去 03/27 18:55
21F:→ wieldthewave: 估计参数 03/27 18:55
22F:推 a22735557: 标准做法还有kernel density estimation 或是更直观的 04/02 02:45
23F:→ a22735557: histogram 去试着看出资料的 distribution ,也有不 04/02 02:45
24F:→ a22735557: 少针对 distribution 的检定可以做,接着再用一楼说的 04/02 02:45
25F:→ a22735557: 方法去继续分析 04/02 02:45