作者fz77 (fz77)
看板DataScience
标题[问题]10-fold validation的资料集非10的倍数
时间Wed Jan 11 03:36:06 2023
请问各位前辈,若我有一个资料集要进行多分类(如:每类79张图片共116类),共有9164张
图片,但9164不是10的倍数,是否就无法进行10-fold cross validation了呢?
因按照定义,应该要切出9/10进行训练,1/10进行测试,但该资料集是无法被10除尽的,
实务上应该如何进行呢?
感谢各位!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 150.117.153.60 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1673379368.A.46B.html
1F:→ lycantrope: 认真问?反串?洗文章?どっち 01/11 07:00
2F:推 wang19980531: 下一篇 data size是64*64*3 input neurons是 32*3 01/11 09:57
3F:→ wang19980531: 2*3 是不是就不能做了呢 01/11 09:57
4F:推 wieldthewave: 如果有10个糖果要分给3个人要怎麽办 01/11 17:17
5F:→ wieldthewave: 10不能被3整除是不是就不能分给3个人了呢 01/11 17:17
6F:→ chang1248w: 某类多几张少几张不是问题,class weight修正一下 01/12 22:44
7F:推 NDEJG: 我做的时候是让他数量尽量平均,stratification 有做就好 01/13 12:27
8F:→ NDEJG: 的话出来结果也不会差多少 01/13 12:27
9F:→ chang1248w: 脏的样本去掉还比较重要 01/13 16:43