作者jaids (做工的人)
看板DataScience
標題[問題] statistical modeling如何知道distributi
時間Tue Mar 21 17:40:13 2023
統計題目通常都是給定已知distribution
然後這之後由data估計出mean, variance等未知變量(data analysis)
我好奇如何能從一群data估計出是什麼distribution?
就是說statistical modeling是怎麼做的? 先感謝各位的回覆與建議了 謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 92.221.218.184 (挪威)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1679391616.A.837.html
1F:推 wtchen: 應該是先「假設」其distribution再去求相關參數吧 03/21 18:53
2F:推 yiche: 同一樓看法 03/21 20:14
3F:推 yiche: 看設的random variable情境為何,在不同情境有不同適用的 03/21 20:18
4F:→ yiche: 機率分佈,至於準不準確我認為有待樣本做大之後再檢驗了 03/21 20:18
5F:推 SilenceWFL: 承上述大大討論:統計模型之所以是「統計」,是因為 03/22 00:47
6F:→ SilenceWFL: 基於研究者對這個領域的了解與前人經驗的累積,才能 03/22 00:47
7F:→ SilenceWFL: 針對變數提出很強的分佈假設,透過這樣的假設才能進 03/22 00:47
8F:→ SilenceWFL: 一步推敲變數與應變數的關係 03/22 00:47
9F:→ SilenceWFL: 當然這時就會有人質疑,前人經驗與當下情境有所出入 03/22 00:51
10F:→ SilenceWFL: ,究竟是否合適繼續使用同樣的分佈假設;這時除了可 03/22 00:51
11F:→ SilenceWFL: 以透過檢定佐證外,也可以透過各式各樣的手段放寬分 03/22 00:51
12F:→ SilenceWFL: 佈假設的限制(比方說robust, panel data… 03/22 00:51
13F:推 raiderho: 標準做法不就是 kernel density estimation 嗎? 03/22 14:30
14F:推 carolian: 可以用Central limit theorem假設distribution 03/22 15:53
15F:推 bearching: 看你要做什麼用 如果是計量相關分析可以用GMM方法 只要 03/22 17:25
16F:→ bearching: 知道動差就可以跑了~回到問題本身 所以要先觀察data阿 03/22 17:25
17F:→ bearching: 學這麼多分配就是要讓你知道資料有這些種類的特性 都 03/22 17:26
18F:→ bearching: 不是那些學過的話再來談 03/22 17:26
19F:推 wieldthewave: 推一樓 03/27 18:55
20F:→ wieldthewave: 比較「統計化」的執行方式應該是先猜測分佈然後再去 03/27 18:55
21F:→ wieldthewave: 估計參數 03/27 18:55
22F:推 a22735557: 標準做法還有kernel density estimation 或是更直觀的 04/02 02:45
23F:→ a22735557: histogram 去試著看出資料的 distribution ,也有不 04/02 02:45
24F:→ a22735557: 少針對 distribution 的檢定可以做,接著再用一樓說的 04/02 02:45
25F:→ a22735557: 方法去繼續分析 04/02 02:45