DataScience 板


LINE

一點淺見提供思考: 其實 epoch number 也可以想成是另一個要選擇的「超參數」 而這個超參數對於模型複雜度的影響,可以看這個投影片的第二十一頁 https://www.csie.ntu.edu.tw/~htlin/mooc/doc/212_handout.pdf ※ 引述《lucien0410 (lucein)》之銘言: : ot大的建議讓我弄懂了neural net訓練時 : 為什麼都要附上一組validation set : (如果我又錯了 再請g大幫我validate一下!) : 是的 我們就假設 如果沒有validation set會發生什麼事 : 另外我們再來假設 我們有無窮無盡的時間或是運算資源 : 沒有validation set 我們可以訓練neural net嗎? : 答案是可以的 YES! : 訓練到底需要什麼: : (1) 訓練資料 : (2)預先設好的超參數 (e.g. layer size, layer type, mini batch size 等等; : 特別注意 我沒有設定epoch size; 或者我們把epoch size設為無限大(反正我們有無限 : 的時間和運算資源); : (1)(2) 弄好就可以開始epoch by epoch 的訓練了; : 每次搞定一個epoch 我們就會得到一個模組 : 我們讓它訓練到天荒地老; 產生無數個模組; : 用數學集合的方式來表示的話,我們就會得到下面的集合. : trained_models= : {<epoch_i, train_preplexity_i, train_accuracy_i, Same_HyperParameter> |for i : in N } : 這個時候問題就來了!!! : trained_models 是一個無限大的集合 我們想要從中挑一個最好成員 那該怎麼挑呢? : 這些成員的超參數都一樣 所以超參數不能用來作為挑選的依據 : 那有哪些特徵是可能有用的呢? : train_preplexity, train_accuracy 可能有用 但很可能不準 因為我們會有overfitting : 的問題; epoch number也不能用, 因為也不一定高的epoch越好, 一樣是overfitting的問 : 題. : 每個epoch的模組都一模一樣!!! : 這樣就像唐伯虎點秋香 每個都戴上面具 那個才是我們的秋香呢? : 隨便選一個 大家拼人品嗎? 挑到石榴姊怎麼辦? : 唐伯虎就大喊了 "別人笑我太瘋癲 我笑他人看不川 ..." : 看誰抖了一下 : 我們可以用類似的方式 : 預先準備好一個validation set,每個epoch訓練好,就要它預測validation set看看 : 現在加進了validation set, 我們的模組集合就會變成這樣 : {<epoch_i, train_preplexity_i, train_accuracy_i, validation_preplexity_i, : validation_accuracy_i, Same_HyperParameter> |for i in N } : 現在我們就可以從validation preplexity 和 accuracy 來判斷要挑那個好. : 注意這裡,我們依然*不是*挑超參數,因為這組模組集合的成員的超參數還是依然一模一樣 : 現在我的理解就變成跟著一起訓練的validation set的作用就是用來挑ephoch number了 : 還有 這裡的validation 跟 cross validation 沒有關聯; 因為我們沒有*cross* : 用的一直是同一份的validation dataset : 這個就僅僅算是*hold-out validation* : 以上是算是澄清事實吧 : 要是講錯了 再麻煩大家指點! : ###################################### : 以下我再來提問 兩個問題 : (a)用偷偷把validation set塞回去 這樣好嗎? 會有什麼問題? : 如果這個validation set就是拿來挑 那個ephoch好, : 那我們現在可以作弊一下 : 我們先使用validation set 找到最佳的ephoch number : 記住這個黃金數字 : 現在把validation set放到training set 兩個合在一起 : (這樣我們就有更多樣本了) : 再把這個新的較大的training set再重新一次 : 反正我們已經*預先*知道那個epoch最好了 : 用偷偷把validation set塞回去 這樣好嗎? 會有什麼問題? : 實作上 這是慣用手法嗎? : (b)用了validation set 就*一定*能挑到最好的了嗎? : 我認為覺得不是 這跟我們的validation set挑的好不好非常有關 : 要是人品不好 正好挑到不具代表性的樣本來做validation : 那我們的validation preplexity 和 accuracy 也就不可靠了 : (以後我要罵人都要罵 "祝你的validation set都挑到壞樣本!" : 推文就說 "希望你的validation set挑的特別好!") : 這個也呼應了pipidog大前文說的 validation set 怎麼挑是個大學問 : validation成績最好 應該也不是一定最好的模組吧 : 要避免挑到極端樣本的機會 還是得來弄一下n-fold cross-validation : 但是弄了n folds 之後訓練時間就增加了n倍 : 除了增加時間成本外 這樣的作法可能會有什麼問題呢? : 實作上 這是慣用手法嗎? : ※ 引述《outrunner (ot)》之銘言: : : 不如你來回答問題, 你怎麼知道模型要訓練到什麼時候(epoch size)? : : 這樣做當然很好, 但代價也很昂貴. : : 回到上面的問題, 你需要驗證多少次? 每個epoch驗證一次? : : 更別提很多時候是沒辦法這樣做的. : : (ex. B沒有答案. 有的話我會拿來做訓練) : : 他就是邊訓練邊測試啊, 不然你怎麼知道訓練得如何了? : : 其實就是把你想手動做的事情自動化啦. : : 如果你有看他的說明書: : : Validation files are required and used to evaluate : : the convergence of the training. : : It usually contains no more than 5000 sentences. : : 第一句就是前面講的. : : 第二句的意思是做這個很浪費時間. (別誤會, 是學問很大的意思) : : 然後"找尋最佳的hyperparameter"也不是很重要, : : 想太多不如先train下去, train久了就有fu了. --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.171.48.158
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1522535352.A.1BC.html
1F:推 lucien0410: 多謝老師指導! stop in the middle 04/01 06:59
2F:推 lucien0410: 有不靠validation 就能估計middle 在哪裡的可能性嗎 04/01 07:01
3F:推 TOEFLiBT100: \田神/ 04/01 18:45
4F:推 warex14: 推推! 04/01 20:14
5F:推 EQQD: 拜田神 04/02 08:58
6F:推 kevin1ptt: 推田神! 04/06 16:46







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Tech_Job站內搜尋

TOP