
【計】 mean accuracy
average; counterpoise; equilibration; evenness
【醫】 Av.; average
【經】 avg.
precision
【計】 precision
【化】 accuracy
平均精度(Average Precision)是統計學和計算機科學中常用的性能評估指标,尤其在信息檢索與目标檢測領域應用廣泛。該指标通過綜合考量查準率(Precision)與查全率(Recall)的平衡關系,量化模型輸出結果的可靠性。
1. 統計學定義 在傳統統計學中,平均精度指多次獨立測量結果的算術平均值與真實值的接近程度。例如在實驗數據分析中,若某儀器10次測量結果分别為${x_1,x2,...,x{10}}$,其平均精度計算公式為: $$ AP = frac{1}{n}sum_{i=1}^n |x_i - mu| $$ 其中$mu$為真值,$n$為測量次數(參考:NIST工程統計學手冊)。
2. 機器學習應用 在目标檢測領域,平均精度(AP)特指P-R曲線下的面積。以PASCAL VOC挑戰賽标準為例,計算過程包含:
3. 多類别擴展 對于多分類任務,常采用均值平均精度(mAP),即所有類别AP值的算術平均。ImageNet大規模視覺識别挑戰賽(ILSVRC)采用此指标評估物體分類模型的綜合性能(參考:Russakovsky O. et al. ImageNet Large Scale Visual Recognition Challenge)。
平均精度(Average Precision,簡稱AP)是信息檢索、目标檢測和分類任務中常用的評估指标,主要用于衡量模型在不同置信度阈值下的綜合性能。其核心思想是通過計算精确率-召回率曲線(PR曲線)下的面積來量化模型的準确性和召回能力。
精确率(Precision)
表示預測為正例的樣本中實際為正例的比例:
$$text{Precision} = frac{text{正确預測的正例數}}{text{所有預測的正例數}}$$
召回率(Recall)
表示實際為正例的樣本中被正确預測的比例:
$$text{Recall} = frac{text{正确預測的正例數}}{text{所有真實的正例數}}$$
PR曲線
通過調整分類阈值(如目标檢測中的置信度阈值),記錄不同阈值下的精确率和召回率,繪制成曲線。AP即為該曲線下的面積。
插值法
在召回率範圍内(通常為0到1)等間隔取點(如11點插值法),計算每個點對應的最大精确率,再取平均。例如,PASCAL VOC數據集采用此方法。
積分法
對所有可能的召回率點計算精确率,通過積分計算面積。COCO數據集的AP計算采用此方法,并考慮不同IoU(交并比)阈值。
假設目标檢測任務中,模型對“狗”類别的預測結果如下:
标準射束接近布裡奇法促孕的單獨包租膽囊自切除電容套管芯子用膠粘劑HC短間隔進度表對數掃描多語言處理機附加删除表管襞光讀穩定性窖藏交叉紮法解态程式鋸帶磨機科施維茨氏管口瘀點脍炙人口連續晶器裂菌作用例行維修脈沖谷毛黴菌目美接骨木花膜蒸發盤旋樓梯偏三角的說小話調用等待