
【电】 hamming distance
Chinese; man
bright; clear; clear-sighted; honest; immediately following in time
understand
【医】 phanero-
be apart from; distance; interval; remove; space
【计】 geodesic distance
【医】 distance; telorism
汉明距离(Hamming distance)是信息论与编码理论中的核心概念,指两个等长字符串在相同位置上不同字符的数量。该术语由美国数学家理查德·汉明(Richard Hamming)于1950年提出,英文定义为:"the number of positions at which the corresponding symbols of two equal-length sequences differ"。
数学表达式: $$ H = sum_{i=1}^{n} delta(s1_i, s2_i) $$ 其中当$s1_i eq s2_i$时$delta=1$,否则为0。
应用限制:仅适用于等长序列比较,例如二进制码"10101"与"10011"的汉明距离为2。
注:本文引用的学术著作与期刊论文可通过IEEE Xplore数字图书馆或SpringerLink数据库获取完整文献。
汉明距离(Hamming Distance)是信息论和计算机科学中用于衡量两个等长字符串在相同位置上不同字符个数的度量指标。其核心概念可概括为:
对于两个长度相同的字符串或二进制序列,汉明距离等于它们对应位置上字符不同的数量。例如:
1010
与 1001
的汉明距离为2(第3位和第4位不同)。A
(二进制 01000001
)与 B
(二进制 01000010
)的汉明距离为1(仅最后一位不同)。若两个等长字符串分别为 ( a = (a_1, a_2, ..., a_n) ) 和 ( b = (b_1, b_2, ..., bn) ),其汉明距离 ( H(a,b) ) 可表示为: $$ H(a,b) = sum{i=1}^{n} delta(a_i, b_i) $$ 其中 ( delta(x,y) ) 为指示函数:当 ( x eq y ) 时为1,否则为0。
汉明距离的局限性在于仅适用于等长序列。若需处理不等长数据,需结合其他方法(如补零或标准化)。
【别人正在浏览】