作者jackhzt (巴克球)
看板Statistics
标题[问题] 如果比较模型是否合适?
时间Thu Nov 26 16:08:45 2015
今天一笔资料 我们去作线性模型和 广义线性模型 要如何比较那个模型较好?
再者残差分析在广义线模有用吗?
R^2外 有其他看配适是否优劣的方法吗?
请各位大大赐教~
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 39.8.85.58
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1448525327.A.ED8.html
1F:→ allen1985: 广义线性模型是指?11/26 22:09
2F:→ ghd123483: Glm吧?11/26 23:44
恩 是GLM的意思
有比较两者优劣的方法吗? >"<
※ 编辑: jackhzt (39.8.85.58), 11/26/2015 23:52:26
3F:→ kangoroo: AIC, BIC, SBC,...etc 应该…可用11/27 00:02
4F:→ allen1985: 我知道是GLM 我只是想问详细一点的model长怎麽样11/27 02:32
5F:→ allen1985: 一定有些criterion可以比较不同的模型 但为什麽需要用11/27 02:33
6F:→ allen1985: GLM 一定有其原因 我只是希望原po多想一下这个 而不是11/27 02:34
7F:→ allen1985: 直接fit两个模型 来比较 这个比较好就用这个 这样11/27 02:34
8F:→ allen1985: GLM可以有几百种11/27 02:35
9F:→ allen1985: 每个模型都有其假设 先想一下这些假设11/27 02:44
如果有一笔资料 它是poisson的样子 但是今天我故意忽略这个事实 而强用线性回归去配
适它 且线性的R^2有0.8多 而改用GLM的poisson 回归再做一次 发现是比较好的 那我该
用那些理由来说明它(poisson reg.)的配适比较好
※ 编辑: jackhzt (110.26.146.23), 11/27/2015 03:20:30
10F:→ andrew43: 如果资料真的适合poisson且次数不多(即y值不大)那可能11/27 03:29
11F:→ andrew43: 用poisson较佳。11/27 03:30
12F:→ andrew43: 建议你看看y本身分配的偏度大不大。11/27 03:30
13F:→ allen1985: 如果你最後的目的是预测 那麽线性回归的预测值合理吗11/27 04:04
14F:→ LiamIssac: 先看random error的distribution 如果normal 可用一般11/27 10:09
15F:→ LiamIssac: 回归 如果不normal 就看看是否符合其他exponential fam 11/27 10:09
16F:→ LiamIssac: ily 这时候用glm 11/27 10:09
谢谢大大们的说明
那有没有除了主观判断外 比较有明确准则的检定 对於一个linear vs GLM?
※ 编辑: jackhzt (110.26.146.23), 11/27/2015 11:55:19
17F:→ celestialgod: AIC应该是最简单的吧11/27 12:05
18F:→ celestialgod: poisson还要check over-dispersion的部分 11/27 12:05
19F:→ celestialgod: 不过还是建议透过了解资料跟模型的假设建模比较恰当 11/27 12:06
20F:→ celestialgod: 不应该只是透过criterion去决定模型 11/27 12:07
这边想再询问一下 对於AIC我的理解是 选择是否要选取此参数 加入模型来讨论
如果光比较AIC是洽当的吗?(上次因为这问题在台上罚站许久 =口=)
※ 编辑: jackhzt (110.30.129.26), 11/27/2015 15:45:03
21F:→ allen1985: 没有一个准则可以适用於比较任意两种模型 11/27 16:39
22F:→ allen1985: 真的不建议你单纯说用AIC 你应该要去了解 每个准则 11/27 16:40
23F:→ allen1985: 重视的地方在哪里 优缺点在哪里 差异在那里 11/27 16:40
24F:→ allen1985: 在台上罚站许久 应该是来自於 你对於这些准则的不了解11/27 16:41
25F:→ allen1985: 却用它来做结论11/27 16:41
26F:→ allen1985: 不同的准则 常常会给出不一样的答案 11/27 16:42
27F:→ allen1985: 请问你fit这模型用意是什麽呢 11/27 17:09
28F:→ celestialgod: 我後来稍微查一下,不同link functions是不能比较AI 11/27 19:18
→ celestialgod: C的,目前比较可行的方法应该是用MSE
11/27 19:18
谢谢大家的指教
这模型主要是预测未来的趋势 再比较谁比较准
刚刚看了蛮多资料的 会试试看Mse或其它方式 CV也许也是好选择 关於aic也在看它的资
料中 谢谢大大们~
※ 编辑: jackhzt (110.30.129.26), 11/28/2015 00:37:19
29F:→ kangoroo: 你应该要看你所重视的点是什麽(例:效率性、准确性…等) 11/28 15:35
30F:→ kangoroo: 比较才有意义 11/28 15:35
31F:→ kangoroo: 单就模型来说 没有哪一种是一定比另一种来得好或坏 11/28 15:36
32F:→ kangoroo: 要看使用者的目的跟资料特性的配适 11/28 15:37