ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

交叉验证的原理以及实战

2021-12-01 13:58:43  阅读:429  来源: 互联网

标签:实战 交叉 LOOCV 验证 Cross MSE Validation


目录


前言

交叉验证的由来:在机器学习的过程中,我们不能将全部数据都用于数据的模型训练,否则会导致我们没有数据集对该模型进行验证,无法评估模型的预测效果。


一、交叉验证(Cross-Validation)

众所周知,模型训练的数据量越大时,通常训练出来的模型效果会越好,所以如何充分利用我们手头的数据呢?

1-1、LOOCV(Leave-One-Out Cross Validation)

这个方法是将数据集分为训练集和测试集,只用一个数据作为测试集,其它的数据都作为训练集,并将此步骤重复N次。
在这里插入图片描述
结果就是我们训练了n个模型,每次都得到一个MSE,计算最终的MSE就是将这n个MSE取平均。
缺点是计算量太大。

1-2、K-fold Cross Validation

为了解决LOOCV计算量太大的问题,我们提出了K折交叉验证,测试集不再只是包含一个数据,而是包含多个数据,具体数目根据K的选取而决定,比如说K=5。即:
1、将所有数据集分为5份。
2、不重复地每次取其中一份作为测试集,其它四份做训练集来训练模型,之后计算该模型在测试集上的MSE
3、5次的MSE取平均,就得到最后的MSE。

优点
1、相比于LOOCV,K折交叉验证的计算量小了很多,而且和LOOCV估计很相似,效果差不多
2、K折交叉验证可以有效的避免过拟合和欠拟合的发生。

1-3、k的选取

根据经验,k一般都选择为5或者是10。

二、K折交叉验证实战。

参考文章
【机器学习】Cross-Validation(交叉验证)详解.
交叉验证(Cross Validation).


总结

提示:

标签:实战,交叉,LOOCV,验证,Cross,MSE,Validation
来源: https://blog.csdn.net/weixin_42475060/article/details/121648979

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有