作者retest75 (再一次)
看板DataScience
标题[问题] 关於模型训练时的影像输入大小
时间Thu Apr 25 22:07:01 2024
最近在做些影响辨识的实作想到的一个问题
一般影像辨识网路像是ResNet的架构都有固定的输入尺寸,常见的影像大小大概就256*256
这种等级的尺寸
但是现今的图片大小应该不太可能这麽小吧?
如果以真实世界的影像来说,要输入这类的网路势必就要做resize的动作
但是将图片任意resize不是相对的也可能会遗失一些资讯吗?
如果是1024*1024调整成256*256,这就直接小了16倍欸
一般的猫狗辨识可能不会有太大问题,但如果今天是医学影像的话,这些遗失资讯搞不好就
是对疾病很重要的特徵
还是说这种情况可以直接把输入尺寸打掉重练,按照原始架构重新手刻一个网路然後调整每
层的维度以适应新的输入?
目前有想到另一个方法,使用像Unet那种多尺度的方式来做,不知道这可不可行?
有爬了一些文但好像都没有看到类似的应用或文章,所以上来请教大家
感谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.82.188.41 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1714054023.A.736.html
1F:推 chang1248w: 我不知道你有多宽,先假设你胸腔是100cmx50cm的巨无 04/26 02:12
2F:→ chang1248w: 霸尺寸好了 04/26 02:12
3F:→ chang1248w: 0.1cm的解析度扫出来的图像也才1000x500而已喔 04/26 02:15
4F:→ chang1248w: 比起解析度,患者呼吸或显影剂的影响更大一些,一般 04/26 02:21
5F:→ chang1248w: 比一公分小的肿瘤医生要认出来就要凭运气了 04/26 02:21
6F:→ chang1248w: 至於模型,主流的大小是384或224,但是上至512或768 04/26 02:26
7F:→ chang1248w: 的也大有人在,另外transformer 是不受输入大小影响 04/26 02:26
8F:→ chang1248w: 的 04/26 02:26
9F:→ chang1248w: 受限的只有你的荷包 04/26 02:27
10F:→ chang1248w: 文献的话 04/26 02:46
12F:→ chang1248w: 这篇探讨解析度对判症的影响 04/26 02:46
13F:→ chang1248w: 如果你说分类任务不够好啦,那也有做结核病辅助圈选 04/26 02:50
14F:→ chang1248w: 啊 野鸡刊 04/26 02:55
16F:→ chang1248w: 分类确实有保持在原始尺寸,在512做的倾向 04/26 03:10
17F:→ chang1248w: 你与其担心单张图片的解析度,不如担心第三个维度带 04/26 03:12
18F:→ chang1248w: 来的尺寸问题 04/26 03:12
19F:→ chang1248w: 这篇survey 做在vit刚问世後几个月,所以没有包含相 04/26 03:14
20F:→ chang1248w: 关技术 04/26 03:14
21F:→ chang1248w: 超高解析度收受的只有高频纹理和比较小的物件,这部 04/26 03:26
22F:→ chang1248w: 分分割比较常出现 04/26 03:26
23F:→ chang1248w: 你想找input size free的模型,现在就是transformer 04/26 03:29
24F:→ chang1248w: 之前continuous kernel之类的工作多半和他们本身一样 04/26 03:29
25F:→ chang1248w: 冷僻 04/26 03:29
26F:推 fragmentwing: 之前也有想过这个问题 但是看到模型里一大堆的maxpo 04/26 15:14
27F:→ fragmentwing: ol层之後就觉得 应该没想像中严重 04/26 15:14
28F:→ fragmentwing: 另外一楼好专业 04/26 15:15
29F:→ truehero: 用crop保持元解析度预测,再把每个slice结果组合回来就 04/28 07:50
30F:→ truehero: 好 04/28 07:50
31F:推 fragmentwing: 楼上这样要不要再加一组resize缩小的方便捕捉较大的 04/28 18:36
32F:→ fragmentwing: 物体? 04/28 18:36
33F:→ wuyiulin: 楼上如果分类任务的话可以做多尺度特徵 04/30 15:30