作者Xuan3716 (蛋)
看板DataScience
標題[問題] 該如何在CNN使用unlabeled data?
時間Mon Dec 20 22:22:18 2021
作業系統:Win10
問題類別:CNN
使用工具:python
問題內容:
各位版友好,小弟是深度學習的新手,目前正在學習如何使用CNN辨識圖片中的衣物是哪種款式,
現在使用tensorflow.keras 模型為VGG16,單純只使用train data的準確率只有0.76,這個
成績非常不理想,雖然有額外的unlabeled data,約為5000張的圖片,但是不知道怎麼從co
de下手,實際運用在程式裡。所以想請教各位前輩,指點一下小弟,謝謝。
----
Sent from
BePTT on my iPhone 12
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.72.82.180 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1640010140.A.935.html
※ 編輯: Xuan3716 (140.112.38.189 臺灣), 12/20/2021 22:34:03
1F:推 jigfopsda: 建議先換 efficientnet 或 nfnet 或其他最近的 model 12/20 22:33
2F:推 yoyololicon: 你想做semi-supervised,unsupervised learning? 12/20 22:35
3F:→ Xuan3716: 目前只用到知道答案的train data,我想做semi-surpervis 12/20 22:48
4F:→ Xuan3716: ed learning。 12/20 22:48
5F:→ Xuan3716: 如果想再增加7%的準確率,只能換一個model了嗎?謝謝各 12/20 22:49
6F:→ Xuan3716: 位前輩。 12/20 22:49
7F:→ jigfopsda: 可能有其他方法,不過換 model 最快吧!我看 keras 也 12/20 23:00
8F:→ jigfopsda: 有內建 efficientnet 12/20 23:01
10F:→ chang1248w: 你原本的資料集多大? 12/21 01:40
11F:→ chang1248w: 有做 argumentation? 12/21 01:41
12F:→ chang1248w: 最簡單的方法是用預訓練的模型幫所有資料編碼,再用k 12/21 01:47
13F:→ chang1248w: nn之類的算法以標籤過的數據幫沒有標籤過的數據上標 12/21 01:47
14F:→ chang1248w: 籤,最後用這些標籤訓練模型 12/21 01:47
15F:→ chang1248w: 近期一點的可以先用所有資料做語義的自回歸模型,再 12/21 01:49
16F:→ chang1248w: 用標籤訓練任務模型 12/21 01:49
17F:→ Xuan3716: Train data有9279筆,test data 有2800筆,unlabeled 12/21 12:07
18F:→ Xuan3716: data有5277筆。 12/21 12:07
19F:→ chang1248w: 不無小補 12/22 05:55
20F:→ Xuan3716: 謝謝各位前輩! 12/22 19:22
21F:推 TuCH: 才5000張 我的建議是直接label 01/01 23:26
22F:→ TuCH: 1張5秒 25000秒 約8小時 01/01 23:27