Re: [问题] 关於K-fold交叉验证的一段程式码

时间Tue Mar 9 00:40:48 2021

※ 引述《Tombo (Tombo)》之铭言： : 自己的理解是 : 交叉验证只建立一次模型 : 之後执行k次拆解训练集去训练跟验证 : 但图中回圈中会呼叫四次build_model方法 : 不过为什麽不会变成重新建立四次新模型，而覆盖之前的权重？ : 自己以为会是建立一次编译模型後 : 再连续四次用切割过的不同子资料集 : 呼叫fit做训练就好 : 谢谢你的理解不完全正确。 K-fold事实上主要验证的并不是「训练出的模型」，而是「用来训练模型的演算法」以及「演算法使用的参数」。它主要的目标是，利用到所有资料都做过training也做过testing，去确认说至少在我手上拥有的所有资料，不管怎麽切分做训练跟测试，我现在用的这个演算法跟搭配的参数都可以有好的表现。如果前述成立了，那麽当我真的所有资料都拿来training，这时我没有testing 可以先测了，但是因为我们测过K-fold，所以我们相对就比较有信心说完整资料用这个演算法搭这个参数表现也会好。但也不是没有办法直接利用K-fold训练出来的K个Model而不要重来。最常见的简单做法有两个，一个是如果理论上Model里面的权重之类进行平均是有意义的，那可以直接平均得出一个单一平均Model。另一个做法是保留这K个Model，每次要处理新资料，则K个Model都跑过一次，最後取平均或投票决定最终答案。这样的做法可以说是类似bagging的概念。要注意的是K-fold推广到使用完整资料这件事情并非100%会成立，例如某个演算法的参数设定对资料点的密度很敏感，则K-fold时的密度是完整资料的(K-1)/K而已，就会导致K-fold时的最佳参数其实可能无法直接用在拿完整资料来训练的情况。 -- 「可是你......不是天使吗？」「天使？」她缓缓的转过头来，用悲伤的表情。「天使，只不过是神创造出来的不死玩偶。」「而神，也只不过是诅咒下的伪善使者。」－－星．幻．梦的传说 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.250.171.101 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1615221650.A.035.html ※ 编辑: ddavid (111.250.171.101 台湾), 03/09/2021 00:44:35

1^F：推 Tombo: 谢谢说明,我可能要再回去好好想想,感谢 03/09 13:32

2^F：推 IsOneWaY: 推 03/09 20:25

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Python 板

Re: [问题] 关於K-fold交叉验证的一段程式码

热门看板

赞助商连结