阅读(2k) 书签 (0)

AI人工智能 分类器的性能

2020-09-23 15:38 更新

在实现机器学习算法之后,我们需要找出模型的有效性。 衡量有效性的标准可以基于数据集和度量标准。 为了评估不同的机器学习算法,我们可以使用不同的性能指标。 例如,假设使用分类器来区分不同对象的图像,可以使用分类性能指标,如平均准确率,AUC 等。从某种意义上说,我们选择评估机器学习模型的指标是非常重要的,因为指标的选择会影响机器学习算法的性能如何被测量和比较。 以下是一些指标 -

混乱矩阵

基本上它用于输出可以是两种或更多种类的分类问题。 这是衡量分类器性能的最简单方法。 混淆矩阵基本上是一个包含两个维度即“实际”和“预测”的表格。 这两个维度都有“真正的正面(TP)”,“真正的负面(TN)”,“错误的正面(FP)”,“错误的否定(FN)”。

img

在上面的混淆矩阵中,1表示正类,0表示负类。 以下是与混淆矩阵相关的术语 -

  • 真正 - 当实际的数据点类别为 1 并且预测也为 1 时,TP 就是这种情况。
  • 真负 - 当数据点的实际类别为 0 并且预测也为 0 时,TN 就是这种情况。
  • 假正 - 当实际的数据点类别为 0 并且预测也为 1 时,FP 就是这种情况。
  • 假负 - FN 是数据点的实际类别为 1 且预测也为 0的情况。

准确性

混淆矩阵本身并不是一个性能指标,但几乎所有的性能矩阵均基于混淆矩阵。 其中之一是准确性。 在分类问题中,它可能被定义为由模型对各种预测所做的正确预测的数量。 计算准确度的公式如下 - img

精确 它主要用于文件检索。 它可能被定义为返回的文件有多少是正确的。 以下是计算精度的公式 - img

召回或灵敏度 它可能被定义为模型返回的正数有多少。 以下是计算模型召回/灵敏度的公式 -

img

特异性 它可以定义为模型返回的负数有多少。 这与召回完全相反。 以下是计算模型特异性的公式 -

img