
【計】 Bhattacharyya distance
bar; be close to; cling to; hope earnestly
【化】 bar
【醫】 bar
especially; special; spy; unusual; very
【化】 tex
check; consult; examine; investigate
inner; liner; lining; neighbourhood
【法】 knot; sea mile
inferior; second
【醫】 deutero-; deuto-; sub-
be apart from; distance; interval; remove; space
【計】 geodesic distance
【醫】 distance; telorism
巴特查裡亞距離(Bhattacharyya Distance)是統計學和模式識别領域用于衡量兩個概率分布相似性的重要指标。其名稱源自印度統計學家安尼爾·庫馬爾·巴特查裡亞(Anil Kumar Bhattacharya),他于1943年首次提出該概念。在漢英詞典中,該術語對應英文為"Bhattacharyya Distance",也被稱為巴氏距離(Bhattacharyya Coefficient的衍生形式)。
對于兩個離散概率分布$P$和$Q$,其巴特查裡亞距離定義為: $$ DB(P,Q) = -ln left( sum{i} sqrt{P(i)Q(i)} right) $$ 連續概率分布形式則為: $$ D_B(P,Q) = -ln left( int sqrt{p(x)q(x)} , dx right) $$ 該值越大,表明兩個分布的差異越顯著。其數學特性包括非負性、對稱性,且滿足三角不等式。
相較于KL散度(Kullback-Leibler Divergence),巴特查裡亞距離具有對稱性特點,且對分布重疊區域的敏感度更高。但計算複雜度也相應增加,尤其在處理高維數據時需配合降維技術使用。
參考文獻:
巴特查裡亞距離(Bhattacharyya Distance)是一種用于衡量兩個概率分布相似性的統計指标,尤其適用于高斯分布的比較。以下從定義、公式、應用和對比四個方面詳細解釋:
定義
巴特查裡亞距離由統計學家Anil Kumar Bhattacharyya提出,主要用于量化兩個概率分布之間的重疊程度。其值越小,表明分布越相似;反之則差異越大。該距離在模式識别、圖像處理等領域有廣泛應用,例如區分不同類别的數據分布。
數學公式
對于兩個多維高斯分布$P sim N(mu_1, Sigma_1)$和$Q sim N(mu_2, Sigma_2)$,巴特查裡亞距離的公式為:
$$
D_B = frac{1}{8}(mu_1 - mu_2)^T Sigma^{-1}(mu_1 - mu_2) + frac{1}{2} lnleft( frac{|Sigma|}{sqrt{|Sigma_1||Sigma_2|}} right)
$$
其中,$mu$為均值向量,$Sigma$為協方差矩陣,$Sigma = frac{Sigma_1 + Sigma_2}{2}$。該公式結合了均值差異和協方差結構的差異。
應用場景
總結來看,巴特查裡亞距離通過綜合均值和協方差的差異,提供了一種更全面的分布相似性度量方式,尤其在高維數據分析中優勢顯著。
百分比溢價表波羅園不擇手段的行為串并聯代籤刀豆抗菌素低優先級通信業務發迹放置過程附加基闆甘藍素光反應性葉綠素基地址再定位聚集速度烤魚扣繳稅款憑證窺鏡顱頰囊漂白桶汽油膠管群終端設備特殊用途條件語句鐵蒙脫石同時反應脫乙酰殼多糖威克斯氏杆菌微小膜殼縧蟲