ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

《机器学习》 西瓜书习题 第 2 章

2019-12-30 23:56:51  阅读:439  来源: 互联网

标签:西瓜 机器 boldsymbol 反例 TP frac 习题 aligned 500


习题

  • \(2.1\) 数据集包含 \(1000\) 个样本, 其中 \(500\) 个正例、\(500\) 个反例, 将其划分为包含 \(70\%\) 样本的训练集和 \(30\%\) 样本的测试集用于留出法评估, 试估算共有多少种划分方式.

  如果划分要保证正例和反例一样多的话, 那么划分方式数量 \(n\) 有
\[\begin{aligned} n &= C^{500\times35\%}_{500}\times C_{500}^{500\times 35\%}\\ &=(C^{175}_{500})^{2} \end{aligned}\]
  如果不考虑的话则有
\[n = C^{500\times 70\%}_{500}=C^{350}_{500}\]


  • \(2.3\) 数据集包含 \(100\) 个样本, 其中正、反例各一半, 假定学习算法所产生的模型是将新样本预测为训练样本数较多的类别 (训练样本数相同时进行随机猜测) , 试给出用 \(10\) 折交叉验证法和留一法分别对错误率进行评估所得的结果.

   \(10\) 折交叉验证, 我们认为划分是随意的, 那么根据对称性可知, 对于每个子集来说正例更多的概率为 \(\frac{1}{2}\) , 反例也是一样, 所以预测测试集相当于随机预测, 即错误率为 \(50\%\) .
  而留一法要么选择一个正例作为测试集, 要么选择一个反例, 无论是哪一种, 总会预测与测试集相反的结果, 即正确率为 \(0\%\) .
  这告诉我们留一法并不一定比交叉验证法更 '好' . 而要看具体情况选择要划分为几个子集 (即几折交叉验证, 而留一法只是交叉验证法的特例, 即子集数等于样本数, 每个子集包含一个样本) .


  • \(2.3\) 若学习器 \(A\) 的 \(F1\) 值比学习器 \(B\) 高, 试析 \(A\) 的 \(BEP\) 值是否也比 \(B\) 高.

  \(F1\) 值和 \(BEP\) 并没有必然联系, 很容易就可以找出一个反例.


  • \(2.4\) 试述真正例率 (\(TPR\))、假正例率 (\(FPR\)) 与查准率 (\(P\)) 、查全率 (\(R\)) 之间的联系.

根据表
\(2.1\) 分类结果混淆矩阵
|预测结果
真实情况|正例|反例|
|:-:|:-:|:-:|
|正例|\(TP\) (真正例)|\(FN\) (假反例)|
|反例|\(FP\) (假正例)|\(TN\) (假反例)|
则有
\[\begin{aligned} TPR = \frac{TP}{TP+TN}\\ FPR = \frac{FP}{FP + FN}\\ P = \frac{TP}{TP + FP}\\ R = \frac{TP}{TP + FN} \end{aligned}\]


  • \(2.5\) 试证明式 (\(2.22\)).

\[\begin{aligned} \ell_{rank} = \frac{1}{m^+m^-}\sum_{\boldsymbol{x}^+\in D^+}\sum_{\boldsymbol{x}^-\in D^-}\Big(\mathbb{I}\big(f(\boldsymbol{x^+}) < f(\boldsymbol{x^-})\big)+\frac{1}{2}\mathbb{I}\big(f(\boldsymbol{x^+})=f(\boldsymbol{x^-})\big)\Big)\\ (2.21) \end{aligned}\]

标签:西瓜,机器,boldsymbol,反例,TP,frac,习题,aligned,500
来源: https://www.cnblogs.com/cloud--/p/12122258.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有