标签:误差 偏差 训练 验证 李宏毅 模型 笔记 学习 测试
误差
模型的误差来源有两个,分别是误差(bias)和方差(variance)。
不同复杂程度的模型倾向于不同的误差类型,复杂度较低的模型的方差较小,也就更集中,但是偏差较大,易欠拟合;复杂模型离散程度更大,但偏差小,易过拟合。
我们要做的,就是在两种误差中权衡,找出相对平衡的模型。
误差改进
- 偏差大的模型可能是模型复杂程度不够,要考虑更多变量,增加更多次幂。偏差大的情况下盲目添加更多数据是没用的,因为模型本身表现就不好。
- 方差大的模型,最简单的改进方法是增加更多训练数据,但很多情况我们拿不到更多的数据,但是可以通过一些技巧修改已有数据来丰富数据(比如对于图像数据可以偏转图像角度)。
模型选择
模型不可简单根据测试成绩挑选,因为已有的测试集代表不了真实情况或者完整测试集。
- 交叉验证
在训练集中划出一部分作为验证集,通过验证集选出模型后再将验证集放回全部训练集重新训练被选中的模型,然后再在公开测试集上测试。
- n折交叉验证
将训练集分为三部分,三部分数据分别作一次验证集,取平均验证成绩最好的模型。最后用全部验证集训练该模型。
标签:误差,偏差,训练,验证,李宏毅,模型,笔记,学习,测试 来源: https://www.cnblogs.com/ColtranePicnic/p/15022414.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。