作者ctr1 (【积π】)
看板DataScience
标题[问题] 机器学习 re-training
时间Sat Aug 21 23:20:18 2021
想请问当机器学习演算法
上线正式使用後
使用了一阵子後多了些资料
预测错误的资料
想要进行re-train的动作
1.使用原本的model直接fit新资料
2.将所有的资料合并後,再对全部资料重新fit一个新model
这两种是否有不同的用途抑或是都用哪一种居多呢
谢谢前辈指点
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.161.210.148 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1629559220.A.596.html
1F:推 KuChanTung: online learning 08/22 07:03
2F:推 ddavid: 如果能预料会持续有资料进来,或者资料分布会随时间有变动 08/22 22:08
3F:→ ddavid: ,一开始就会采取具备incremental learning性质的方法了 08/22 22:08
4F:→ ddavid: 其实现在很多ANN相关的方式都可以做到 08/22 22:09
5F:推 hsuchengmath: 主要要看你要预测什麽,预测的目标有时效性,那全 03/15 07:53
6F:→ hsuchengmath: 部的资料拿去retrain可能不是好办法,至於使否有时 03/15 07:53
7F:→ hsuchengmath: 效性,可能要做一些资料分析才能知道 03/15 07:53