1.交叉验证测量准确率
在模型训练中,若使用全部的训练数据进行一次训练,可能会出现预测精度非常高的情况,此时应警惕出现了过拟合。因为在对模型效果进行评估时,可以考虑使用K折交叉验证。
采用分层抽样的方法将数据集分为k份,其中k-1份用于训练,剩余1份用于测试,共训练k次,使用k个测试结果的均值。
2.混淆矩阵
交叉验证方法虽然通过求均值的方式避免了因为数据过拟合产生的准确率虚高的假象,但对于一个有偏数据集而言(比如90%数据都是0,只有10%数据是1,此时若预测结果恒为1,仍有90%的准确率但模型没有意义),因此考虑引入混淆矩阵来多维度衡量模型。
矩阵的行表示真实值,列表示预测值。对于一个完美的分类器而言,只会有True的结果,所以只会在对角线上有值。
根据混淆矩阵可以定义精度和召回率来综合衡量模型
$精度=\frac{TP}{TP+FP}$
标签:准确率,机器,训练,混淆,模型,矩阵,学习,数据 来源: https://www.cnblogs.com/maysblog/p/15853732.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。