作者reck0916 (升格當學長)
看板DataScience
標題有關sklearn中的GridSearchCV 的問題
時間Sat Mar 17 19:05:24 2018
請問各位爲何我用GridSearchCV 使用r2當scoring跑出來的最佳参數帶回原本模型xgboost中 ,重跑出來的r2卻不是最好的,是哪裡有問題?
-----
Sent from JPTT on my OPPO CPH1605.
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.141.36.134
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1521284731.A.181.html
1F:推 goldflower: seed? 03/17 19:47
2F:→ reck0916: gridsearchcv seed default 值不是0?? 03/17 22:52
3F:推 goldflower: 應該是看xgboost的seed 不過我看它也是default 0沒錯 03/17 23:28
4F:→ goldflower: 只好交給熟的回答 或是你可以放個扣讓大家看看 03/17 23:29
5F:→ hl4: training set不一樣? 03/17 23:49
6F:→ hl4: best_score_是CV得到的平均值,和refit用的training set不同 03/18 05:19
7F:→ reck0916: 所以是改成refit=True?? 03/18 12:58
8F:→ hl4: 要看你的目的是什麼,cv的score和refit後的score本來就不一樣 03/18 16:31
9F:→ reck0916: 我要的只是得到模型最佳参数而已,還是用其他的調参例如 03/18 18:39
10F:→ reck0916: np 比較好? 03/18 18:39
11F:→ hl4: 那就是GridSearchCV給的那組了阿 03/18 19:37
12F:→ hl4: GridSearchCV只保證給你val score最佳而已,剩下是你的問題 03/18 19:40