作者cawaiilulu (across)
看板Statistics
标题[问题]共线性与预测准确度
时间Wed Dec 23 13:37:07 2015
我建了一个模型 共10个变项 共线性设定vif<5
但是还是有共线性问题 其中三个变项的正负号反过来了
我试着剔除一些相对不合理的变项
但是只要剔除一个 准确率就会下降很多 大约3-4%
例如 两万个人1/0预测 就会差距到快一千人左右
我用了几个不同的样本去测试模型 全都得到同样的结论
就是原来的模型最好 但是却有三个解释起来很麻烦(其实两两比较也很麻烦)的变项
请问大家有遇过这种情况吗? 如果在原模型精准度比较高的情况下
要怎麽处理这些正负号反过来的变项?
谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 74.135.39.138
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1450849031.A.03C.html
1F:→ celestialgod: 只是预测可以考虑PLS,如果要解释模型就要尝试 12/23 13:39
2F:→ celestialgod: 画图去找出哪一组的交互作用影响的 12/23 13:39
3F:→ celestialgod: 不完全是主作用造成正负号不同 12/23 13:40