使用随机森林算法时用到了交叉验证,突然陷入沉思,有测试集的情况下用交叉验证做什么?整理思路如下:
1、训练集,顾名思义,就是拿来训练模型的数据集,通过这个数据训练得到模型的参数;
2、验证集,可以用来做超参数的选取与模型的选取,在没有测试机的情况下也可以评价模型的性能。
3、测试集,用来评价模型的效果。
总结:验证集只是参与模型的选取或者超参数的选取等等,交叉验证虽然做了多个模型,但是实际最终的模型与这多个模型无关,还是用的训练集+验证集训练的,个人理解是如果不涉及到超参数的选取,可以不做交叉验证,即不划分专门的验证集,就拿所有的训练集和验证集建模即可。
注:
参数:就是模型可以根据数据可以自动学习出的变量,应该就是参数。比如,深度学习的权重,偏差等
超参数:就是用来确定模型的一些参数,超参数不同,模型是不同的(比如说:假设都是CNN模型,如果层数不同,模型不一样,虽然都是CNN模型。),超参数一般就是根据经验确定的变量。在深度学习中,超参数有:学习速率,迭代次数,层数,每层神经元的个数等等。
标签:训练,验证,模型,交叉,选取,参数,测试 来源: https://www.cnblogs.com/lmj-sky/p/15136125.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。