
【计】 attributed string translation grammar
属性符号串翻译文法(Attribute String Translation Grammar) 是一种形式化的语法理论,主要用于描述自然语言处理(NLP)和机器翻译(MT)中句子的结构转换与语义属性传递规则。其核心思想是将句法结构与语义属性(如词性、语义角色、上下文信息)绑定为符号串,并通过翻译规则实现跨语言的结构映射与属性继承。
属性(Attribute)
指语言单位(词汇、短语)的附加信息,如词性(POS)、语义类别、时态、数等。例如:
{词性: 动词, 语义: [动作, 摄入食物]}
{词性: 名词, 语义: [水果]}
符号串(Symbol String)
由语法符号(如非终结符 NP
、VP
)和终结符(词汇)组成的序列,例如:
[NP 我] [VP 吃] [NP 苹果]
翻译文法(Translation Grammar)
定义源语言(如汉语)到目标语言(如英语)的转换规则,例如:
[VP 吃 NP] → [VP eat NP]{语义一致性检查}
属性传递规则
翻译过程中需保持语义属性一致。例如:
[NP 苹果] {语义:[水果]}
[NP apple] {语义:[水果]}
若目标语言属性冲突(如“苹果”在语境中指公司),则触发歧义消解规则。
结构映射与约束
通过上下文无关文法(CFG)定义句法树转换,例如:
S → NP VP (汉语)
S → NP VP (英语)
但需处理语言差异(如汉语无主语句对应英语形式主语)。
动态属性计算
属性在翻译中可动态生成,例如:
a/an
或省略)。机器翻译系统
在统计机器翻译(SMT)中,属性符号串用于对齐双语语料。例如:
猫[名词, 动物] 追[动词] 老鼠[名词, 动物]
The[冠词] cat[noun, animal] chases[verb] the[冠词] mouse[noun, animal]
跨语言信息检索
通过属性匹配提升查询精度,例如:
{领域: 经济, 子类: 风险}
,返回英文文档“financial risk”。形式语言理论与翻译模型
Aho, A. V., & Ullman, J. D. (1972). The Theory of Parsing, Translation, and Compiling. Prentice Hall.
属性文法在NLP中的应用
Lewis, P. M., & Stearns, R. E. (1968). "Syntax-Directed Transduction". Journal of the ACM.
汉英机器翻译属性传递模型
冯志伟 (2010). 《自然语言处理的形式模型》. 中国科学技术大学出版社.
输入汉语句: [我] [吃] [苹果]
属性标注:
[我] {代词, 第一人称单数}
[吃] {动词, 及物, 现在时}
[苹果] {名词, 水果}
翻译规则触发:
[代词] → [PRP] (英语代词)
[动词] → [VBP] (第三人称单数动词)
[名词] → [NN] (可数名词单数)
输出英句: [I] [eat] [an apple]
属性校验:
[an apple] {名词, 水果, 单数} → 符合源语义
属性符号串翻译文法是编译原理中结合属性文法和语法制导翻译技术的核心概念,主要用于对输入符号串进行语义分析和翻译。以下是分点解释:
属性文法基础
属性文法在上下文无关文法基础上,为每个文法符号(终结符/非终结符)附加属性值。属性分为两类:
符号串翻译的核心机制
通过语义规则将属性计算与翻译过程结合。例如,提到的示例:输入字符串若含数字n,则将后续字符重复n+1次。此过程通过属性传递和语义动作实现。
语法制导翻译的实现
在语法分析过程中同步执行翻译动作,具体表现为:
典型应用场景
包括代码生成、类型检查、中间代码优化等。例如,提到语法制导翻译器通过综合属性生成代码或填充符号表。
示例说明
以的字符串翻译为例,输入串“2a@”的翻译过程为:
该方法通过属性动态绑定翻译逻辑,实现输入到输出的结构化转换。
薄片形的法律上的解释反传递函数非复接台非特会址回转轴甲基吩嗪减除的焦化期加速时效价值的标准金属锭脊髓硬化可扩充的控制顺序冷却水溶液痢疾领衔临时性诉讼普罗格斯通起动转矩任务分配协议三价镍伤寒带菌者上坡焊水银密封说笑条件前缀词体统