用这个随笔来记录一下评价分类模型中的一些性能指标: 1.混淆矩阵(confusion matrix) 混淆矩阵的格式如下: 其中: TP:预测值为正,真实值也为正,即正确预测出的正样本个数; TN:预测值为负,真实值也为负,即正确预测出的负样本个数; FP:预测值为正,真实值为负,即错误预测出的负样本个数(本
评估假设 分割数据集,典型比例为7:3,通常先打乱再分割,下标m表示样本来自测试集 线性回归 逻辑回归 模型选择 用训练集训练出来的模型再训练集上不能预测出其对于新样本的泛化能力,因此把数据集分成训练集、验证集、测试集,典型为6:2:2 诊断偏差与方差