作者ms0344303 (我不玩了)
看板Python
标题[问题]想找适合预测占比组成的模型
时间Mon Jan 11 14:16:33 2021
作业系统:linux
问题类别:ML、DL、Optimization
使用工具:python3
问题内容:
小弟我遇到一类问题,需要预测一个母体中的各项item的组成成分比例
所以Target可能有A,B,C,D+others五种构成 五种加起来总合为1(100%)
因为是同一母体,所取得用来预测的特徵或讯号是一样的
等於我要用同一组预测五种Y(预测结果举例: A20%, B30%, C10%, D10%, others30%)
看了一下Sklearn的 multiple output regression并没有适合的限制式模型(限制总预测
需小於1)
而如果要自己设计模型
目前想到的是用简单神经网路BPNN 加上客制化的MSE Loss funciton
除了五种Y的MSE加总外再加上惩罚项α(Sum(yA+yB+yC+yD+yOthers)-1)^2
不知道我这样构想有无缺漏,因为就算这样好像也不能保证神经网路出来的总和必定小於
1?
还是有更适合的模型
已经爬很久了 都没有类似的收获
Beta Regression很类似我需求但没有往Multiple Y拓展的参考
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 49.214.202.244 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1610345795.A.2AC.html
1F:→ youngman77: Sklearn LogisticRegressuon multi-class 01/11 22:21
2F:推 sherees: softmax 01/12 17:45