
【计】 mean accuracy
average; counterpoise; equilibration; evenness
【医】 Av.; average
【经】 avg.
precision
【计】 precision
【化】 accuracy
平均精度(Average Precision)是统计学和计算机科学中常用的性能评估指标,尤其在信息检索与目标检测领域应用广泛。该指标通过综合考量查准率(Precision)与查全率(Recall)的平衡关系,量化模型输出结果的可靠性。
1. 统计学定义 在传统统计学中,平均精度指多次独立测量结果的算术平均值与真实值的接近程度。例如在实验数据分析中,若某仪器10次测量结果分别为${x_1,x2,...,x{10}}$,其平均精度计算公式为: $$ AP = frac{1}{n}sum_{i=1}^n |x_i - mu| $$ 其中$mu$为真值,$n$为测量次数(参考:NIST工程统计学手册)。
2. 机器学习应用 在目标检测领域,平均精度(AP)特指P-R曲线下的面积。以PASCAL VOC挑战赛标准为例,计算过程包含:
3. 多类别扩展 对于多分类任务,常采用均值平均精度(mAP),即所有类别AP值的算术平均。ImageNet大规模视觉识别挑战赛(ILSVRC)采用此指标评估物体分类模型的综合性能(参考:Russakovsky O. et al. ImageNet Large Scale Visual Recognition Challenge)。
平均精度(Average Precision,简称AP)是信息检索、目标检测和分类任务中常用的评估指标,主要用于衡量模型在不同置信度阈值下的综合性能。其核心思想是通过计算精确率-召回率曲线(PR曲线)下的面积来量化模型的准确性和召回能力。
精确率(Precision)
表示预测为正例的样本中实际为正例的比例:
$$text{Precision} = frac{text{正确预测的正例数}}{text{所有预测的正例数}}$$
召回率(Recall)
表示实际为正例的样本中被正确预测的比例:
$$text{Recall} = frac{text{正确预测的正例数}}{text{所有真实的正例数}}$$
PR曲线
通过调整分类阈值(如目标检测中的置信度阈值),记录不同阈值下的精确率和召回率,绘制成曲线。AP即为该曲线下的面积。
插值法
在召回率范围内(通常为0到1)等间隔取点(如11点插值法),计算每个点对应的最大精确率,再取平均。例如,PASCAL VOC数据集采用此方法。
积分法
对所有可能的召回率点计算精确率,通过积分计算面积。COCO数据集的AP计算采用此方法,并考虑不同IoU(交并比)阈值。
假设目标检测任务中,模型对“狗”类别的预测结果如下:
保险准备包销权保证汇兑条款保证金交易背板泵轮机不公正的判决磁石的带卷等值杂音压力电弧固氮法辅酵素过渡截面国法剑突炎叫连顺序基础装置进货运费绝对值美元浮动柠檬酸铁凝乳计盘存技术迁移基团拳斗生涎的受托人条款偷嘴脱脂滤纸魏格尔氏立克次氏体