作者andy086 (狐狸)
看板DataScience
標題[問題] Yolo問題詢問
時間Mon Jun 8 13:49:02 2020
板上的各位好,想詢問幾個與Yolo相關的問題
目前手上的圖檔大小約為60000*60000的超大圖
而在做標記的時候也是直接針對整張超大圖做標記
但在訓練時不太可能直接將整張圖丟進去train
1. 所以想問第一個問題
假設我將圖檔切成一張一張1024*1024的小圖,那label的部分該怎麼處理?
例如下圖:在切小圖的時候並無法涵蓋到整個label的區域
所以以圖1來說label的部分就會變成是整個右下角,圖2則為整個左下角對嗎?
https://i.imgur.com/KrfEslQ.png
2. 第二個問題
當我在切小圖時並不會所有的小圖都有標記的區域
所以這樣在存annotation的xml檔時,是不是該張圖就不需要對應的xml檔?
還是也需要只是邊界的部分都填0之類的?
不好意思,再麻煩板上的高手幫忙解答了!謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 163.14.191.156 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1591595345.A.EEC.html
1F:→ magic83v: 對圖片resize呢? 標出box的部分再放大回原圖 06/08 19:10
這方法目前應該不考慮,因為圖片數量也才300張左右,resize會讓資料量不足
且容易失焦?
2F:→ CaptPlanet: 第一個問題 你的想法沒錯 要注意的是分割前處理流程要 06/09 17:41
3F:→ CaptPlanet: 固定好 這樣就把問題轉換成訓練一個對子圖偵測的模型 06/09 17:41
4F:→ CaptPlanet: 第二個問題 切小圖可能會產生大量 negative data 需要 06/09 17:44
5F:→ CaptPlanet: 注意 negative 跟 positive samples 的比例 (資料平 06/09 17:44
6F:→ CaptPlanet: 衡的問題)若像 SSD 這種的就有 hard negative mining 06/09 17:44
7F:→ CaptPlanet: 機制 比例是1:3就不用放沒目標物的圖片 可以參考看 06/09 17:44
8F:→ CaptPlanet: 看 06/09 17:44
了解,謝謝C大說明,確實沒想到會造成比例偏差的問題
那請問沒有目標物的圖片也會需要相對應的xml檔嗎?
※ 編輯: andy086 (163.14.43.88 臺灣), 06/09/2020 18:05:22