作者ctr1 (【積π】)
看板DataScience
標題[問題] 機器學習 re-training
時間Sat Aug 21 23:20:18 2021
想請問當機器學習演算法
上線正式使用後
使用了一陣子後多了些資料
預測錯誤的資料
想要進行re-train的動作
1.使用原本的model直接fit新資料
2.將所有的資料合併後,再對全部資料重新fit一個新model
這兩種是否有不同的用途抑或是都用哪一種居多呢
謝謝前輩指點
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.161.210.148 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1629559220.A.596.html
1F:推 KuChanTung: online learning 08/22 07:03
2F:推 ddavid: 如果能預料會持續有資料進來,或者資料分佈會隨時間有變動 08/22 22:08
3F:→ ddavid: ,一開始就會採取具備incremental learning性質的方法了 08/22 22:08
4F:→ ddavid: 其實現在很多ANN相關的方式都可以做到 08/22 22:09
5F:推 hsuchengmath: 主要要看你要預測什麼,預測的目標有時效性,那全 03/15 07:53
6F:→ hsuchengmath: 部的資料拿去retrain可能不是好辦法,至於使否有時 03/15 07:53
7F:→ hsuchengmath: 效性,可能要做一些資料分析才能知道 03/15 07:53