
指詞林中的才士。 宋 王珪 《賀壽星見表》:“臣某,冒當軸之司,乏詞元之助,徒懷盛際之遇,永祝睿齡之昌。”
“詞元”是漢語語言學中的基礎概念,指在詞彙系統中具有獨立意義的最小語言單位,通常對應詞典中的詞目形式。根據《現代漢語詞典》(第7版),詞元是“能夠獨立運用的、最小的有意義的語言成分”,例如“學習”作為一個詞元,包含了完整的語義和語法功能。在《語言學名詞》(全國科學技術名詞審定委員會,2011年)中,詞元被定義為“詞彙系統的基本單位,不依賴語境即可表達獨立概念”。
從漢語分析角度,詞元具有兩個核心特征:一是語義獨立性,如“山”“水”等單音節詞元可直接指代具體事物;二是語法功能性,例如“的”“了”等虛詞詞元雖無實在語義,但在句子結構中承擔語法作用。北京大學中文系《現代漢語》教材指出,詞元分析對漢語分詞、機器翻譯等領域具有應用價值,尤其在自然語言處理中,準确識别詞元是構建語義模型的基礎。
“詞元”(lemma)是語言學中的一個核心概念,指一個詞彙在詞典中的基本形式,用于統一同一詞族的不同形态變化。例如:
語言學中的定義
詞元是詞彙的“标準形式”,通常作為詞典中的詞條。例如:
計算語言學與NLP中的應用
在自然語言處理中,詞元化(lemmatization)是将詞彙還原為詞元的過程,常用于文本預處理。例如:
與“詞幹”(stem)的區别
詞元是完整的語義單位,而詞幹可能不構成有效詞彙。例如:
實際意義
詞元化能提升文本分析的效率,例如在搜索引擎、情感分析中減少重複統計,增強語義理解的準确性。
阿私筆奏孱顔車迹扯篷拉纖車轸侈盛次祀憚惕蹈壅德守提溜秃盧萼綠恩養風流醖藉蜂起雲湧氛氤分掌丐戶搆搆軌承海薻鶴仗火苗緘書僭妄架言驚立饑驅叩門撅坑塹斂費麟绂龍蛇飛動羅儒絡絲娘鳴鐘閣末梢頭目瞠蜺裳屏事圮族鋪位潛匿喬模喬樣全免诠明任士日差肉皮射入虱蟲儵眒屬行司房隨屬通俗文學晩老子炜發五伯長喜眉笑眼