
n. [統計][語] 詞彙統計學
Lexicostatistics has been used in defense of the traditional family tree.
詞彙統計已用于傳統家譜的防禦。
Lexicostatistics(詞彙統計學)是曆史語言學中的一個定量分析方法,它通過統計和比較不同語言或方言中核心詞彙的相似度,來推斷它們之間的親緣關系及分化時間。其核心假設是:基本詞彙(如身體部位、自然現象、基本動作等)隨時間的變化速率相對恒定且可測量。
基本詞彙表的選擇
通常采用Swadesh list(斯瓦迪士核心詞列表),該表包含約100-200個跨文化通用的基礎概念詞彙(如“手”“水”“吃”)。這些詞彙被認為最不易被借用或替換,能反映語言的深層譜系關系 。
相似度計算與比較
通過對比兩種語言中同一概念詞彙的詞根是否同源(語音和語義對應),計算同源詞百分比。例如,若語言A和B的100詞表中有70個同源詞,則相似度為70% 。
分化時間估算
基于“詞彙替換恒定速率”假說(如每千年替換約14%-19%的核心詞),結合相似度推算語言分化時間。公式可簡化為:
$$ t = frac{ln C}{ln r} times 1000 $$
其中 ( t ) 為分化年數,( C ) 為同源詞比例,( r ) 為保留率(如設定每千年保留率r=0.81)。
應用場景:
争議與局限:
盡管存在争議,lexicostatistics為語言分類提供了可量化的框架,尤其在缺乏曆史文獻的語言研究中仍有重要參考價值。現代研究常結合計算語言學模型改進其算法,以提升準确性 。
參考資料:
lexicostatistics 是語言學中的一個專業術語,其核心含義和相關信息如下:
如需更完整的學術定義或應用案例,可參考語言學專業詞典或相關研究文獻。
stagecapsulearouse controversypotableblursdenotesejaculatedexistedHolaimbibingneedingpollardunilaterallyviscerosomaticborrowed timeheads or tailshuman brainintegrating factorlacquer paintingpolitical scienceRainbow Bridgetake an examinationunder the influence ofdieselizedihedraldiovulatoryexcisablegenoblasthilaiatrology