
【計】 extension identifier
augment; expansion; extend; extension; strengthen
【經】 expand; expansion
【電】 identifier
在漢英詞典編纂與中文信息處理領域,"擴充識别符"(Expanded Identifier)指用于增強計算機對中文詞彙邊界及語義單元識别能力的特殊标記符號或規則集。其核心功能是解決中文分詞歧義、未登錄詞識别及複雜語言結構的處理問題,具體表現為以下兩方面:
分詞歧義消解
在中文文本中,字符組合可能存在多種切分方式(如"美國會"可切分為"美/國會"或"美國/會")。擴充識别符通過添加語法标記或概率規則,輔助系統選擇最合理的分詞方案。例如,《現代漢語詞典》(漢英雙語版)在電子化過程中采用隱式标記庫标識複合名詞的優先切分點。
未登錄詞捕獲機制
針對詞典未收錄的新詞(如網絡用語"元宇宙"),通過預設的構詞規則符(如[動詞性語素]+[方位語素])動态生成識别模闆。北京大學計算語言學研究所開發的《中文概念詞典》便采用此類符碼體系擴展新詞識别能力。
多層級語義标注
在"打"字的英譯處理中,擴充識别符可區分:
跨語言對應強化
中文四字成語"朝三暮四"的英譯需标注<貶義符>與<典故符>,觸發詞典數據庫關聯至"deceive people with tricks"的等效翻譯,此方法見諸《中華漢英大詞典》的典故條目處理規範。
權威參考文獻
“擴充識别符”是一個計算機領域的術語,其英文翻譯為extension identifier。以下是詳細解釋:
詞義解析
組合含義
該詞通常指通過添加特定标識符來擴展系統功能或數據分類能力。例如,在軟件開發中,可能通過新增标識符支持更多數據類型或協議。
應用場景
常見于系統設計、編程語言規範或數據格式定義中,用于描述可擴展的标識體系。例如,XML命名空間、文件格式擴展字段等場景可能涉及此類概念。
若需進一步了解具體技術實現或标準規範,建議參考計算機科學領域的專業資料或文檔。
【别人正在浏覽】