作者ms0344303 (我不玩了)
看板DataScience
标题[问题] 想找适合预测占比组成的模型
时间Mon Jan 11 13:50:25 2021
作业系统:linux
问题类别:ML、DL、Optimization
使用工具:python3
问题内容:
小弟我遇到一类问题,需要预测一个母体中的各项item的组成成分比例
所以Target可能有A,B,C,D+others五种构成 五种加起来总合为1(100%)
因为是同一母体,所取得用来预测的特徵或讯号是一样的
等於我要用同一组预测五种Y(预测结果举例: A20%, B30%, C10%, D10%, others30%)
看了一下Sklearn的 multiple output regression并没有适合的限制式模型(限制总预测需小於1)
而如果要自己设计模型
目前想到的是用简单神经网路BPNN 加上客制化的MSE Loss funciton
除了五种Y的MSE加总外再加上惩罚项α(Sum(yA+yB+yC+yD+yOthers)-1)^2
不知道我这样构想有无缺漏,因为就算这样好像也不能保证神经网路出来的总和必定小於1?
还是有更适合的模型
已经爬很久了 都没有类似的收获
Beta Regression很类似我需求但没有往Multiple Y拓展的参考
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 49.214.202.244 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1610344227.A.1A5.html
1F:→ patrick2dot0: softmax + cross entropy?! 01/11 16:04
2F:→ ms0344303: softmax毕竟比较偏向classification 不确定是否能用来 01/11 17:28
3F:→ ms0344303: 预测真正的比例回归问题 01/11 17:28
4F:→ wtchen: 要不要考虑无/半监督式模型?藉助原资料结构来预测? 01/11 18:18
5F:推 patrick0302: 卡位 我也有这样的研究需求.. 01/11 18:21
6F:推 tigon6260: 试试看最後一层softmax,loss用mse,能符合限制,又能 01/11 21:17
7F:→ tigon6260: 做regression 01/11 21:18
8F:推 bearz: 预测结果的总和当分母算比例不行吗? 01/18 02:55
9F:推 p122607: 我也觉得直接算比例就可以了? 01/18 18:35
10F:推 mewtwo: linear programming + penality function 01/18 21:07
11F:推 ruokcnn: Softmax最合啊 01/21 15:12
12F:→ ruokcnn: Loss用mse +1 01/21 15:13