
【计】 extension identifier
augment; expansion; extend; extension; strengthen
【经】 expand; expansion
【电】 identifier
在汉英词典编纂与中文信息处理领域,"扩充识别符"(Expanded Identifier)指用于增强计算机对中文词汇边界及语义单元识别能力的特殊标记符号或规则集。其核心功能是解决中文分词歧义、未登录词识别及复杂语言结构的处理问题,具体表现为以下两方面:
分词歧义消解
在中文文本中,字符组合可能存在多种切分方式(如"美国会"可切分为"美/国会"或"美国/会")。扩充识别符通过添加语法标记或概率规则,辅助系统选择最合理的分词方案。例如,《现代汉语词典》(汉英双语版)在电子化过程中采用隐式标记库标识复合名词的优先切分点。
未登录词捕获机制
针对词典未收录的新词(如网络用语"元宇宙"),通过预设的构词规则符(如[动词性语素]+[方位语素])动态生成识别模板。北京大学计算语言学研究所开发的《中文概念词典》便采用此类符码体系扩展新词识别能力。
多层级语义标注
在"打"字的英译处理中,扩充识别符可区分:
跨语言对应强化
中文四字成语"朝三暮四"的英译需标注<贬义符>与<典故符>,触发词典数据库关联至"deceive people with tricks"的等效翻译,此方法见诸《中华汉英大词典》的典故条目处理规范。
权威参考文献
“扩充识别符”是一个计算机领域的术语,其英文翻译为extension identifier。以下是详细解释:
词义解析
组合含义
该词通常指通过添加特定标识符来扩展系统功能或数据分类能力。例如,在软件开发中,可能通过新增标识符支持更多数据类型或协议。
应用场景
常见于系统设计、编程语言规范或数据格式定义中,用于描述可扩展的标识体系。例如,XML命名空间、文件格式扩展字段等场景可能涉及此类概念。
若需进一步了解具体技术实现或标准规范,建议参考计算机科学领域的专业资料或文档。
保护绷带表演吡哆酸波顶部分切除磁盘分配电容式压力计杜诺依环法非复制码化学制浆活性衰减基本分析可见信号可继承的租赁权可执行数组语句朗伯氯硝氨密封继电器明板磨损电阻目的法学芡羟孕酮酯染料原液冗余率生物发光探剂食木虫同步机构屠未审问而判决