机器学习之模型评价指标

佚名 6年前 (2018-04-16) 人工智能 2086人围观抢沙发百度已收录

		预测值
		正例	负例
真实值	正例	真正例（A）	假负例（B）
真实值	负例	假正例（C）	真负例（D）

		预测值
		正例	负例
真实值	正例	TP	FN
真实值	负例	FP	TN

模型测试一般用四个指标来衡量：

SRE实战互联网时代守护先锋，助力企业售后服务体系运筹帷幄！一键直达领取阿里云限量特价优惠。

准确率（Accuracy）：提取出的正确样本数/总样本数

召回率（Recall）：正确的正例样本数/样本中的正例样本数，也定义为查全率

精准率（Precision）：正确的正例样本数/预测为正例的样本数，也定义为查准率

F值：等于召回率和精准率的调和平均值

这里需要注意的是召回率和精准率的关系是互斥的，其原因为：

1.对于召回率而言，其分母是固定的，是真实值中正例的数目，我们希望召回率（即查全率）是越高越好的，其极限条件就是当所有值都认定为是正例时，召回率就为1，但是这样做的缺点是无法区分正例和负例，比如，正例为患病人数，负例为健康人数，如果召回率为1，即认为测试样本中的所有人都是有病的，显然这样做是不合理的；

2.如果我们希望召回率增加，即测值中的正例数是增加的，如下表：（其中正例表示患病，负例表示健康，目的是在找出样本中的患病人数）

情况1