
指词林中的才士。 宋 王珪 《贺寿星见表》:“臣某,冒当轴之司,乏词元之助,徒怀盛际之遇,永祝睿龄之昌。”
“词元”是汉语语言学中的基础概念,指在词汇系统中具有独立意义的最小语言单位,通常对应词典中的词目形式。根据《现代汉语词典》(第7版),词元是“能够独立运用的、最小的有意义的语言成分”,例如“学习”作为一个词元,包含了完整的语义和语法功能。在《语言学名词》(全国科学技术名词审定委员会,2011年)中,词元被定义为“词汇系统的基本单位,不依赖语境即可表达独立概念”。
从汉语分析角度,词元具有两个核心特征:一是语义独立性,如“山”“水”等单音节词元可直接指代具体事物;二是语法功能性,例如“的”“了”等虚词词元虽无实在语义,但在句子结构中承担语法作用。北京大学中文系《现代汉语》教材指出,词元分析对汉语分词、机器翻译等领域具有应用价值,尤其在自然语言处理中,准确识别词元是构建语义模型的基础。
“词元”(lemma)是语言学中的一个核心概念,指一个词汇在词典中的基本形式,用于统一同一词族的不同形态变化。例如:
语言学中的定义
词元是词汇的“标准形式”,通常作为词典中的词条。例如:
计算语言学与NLP中的应用
在自然语言处理中,词元化(lemmatization)是将词汇还原为词元的过程,常用于文本预处理。例如:
与“词干”(stem)的区别
词元是完整的语义单位,而词干可能不构成有效词汇。例如:
实际意义
词元化能提升文本分析的效率,例如在搜索引擎、情感分析中减少重复统计,增强语义理解的准确性。
不迁贰财丁长门怨谗凶大旱望云地域分工返正废籍風師阁束犷语汉地好大赫戯后起之秀荒絶毁家纾国俭色简讯角钱角先生靖民景夜侰澁九茎箕仙空然窥导莱公亮拔临涖録序霾昏茂德名行木桃盼接磞头飘萍断梗瓶坠簪折品种佥望黔嬴桥航球籍群鸿戏海溶度三娥省耕拾漏子矢书书页素秋谭言微中桃塞通贼头直上下忠信达雅