
【计】 machine translation; mechanical translation; MT
机器翻译(Machine Translation, MT)指通过计算机程序自动将一种自然语言转换为另一种语言的技术。其核心目标是实现跨语言信息传递,降低人工翻译成本。根据《牛津英汉双解词典》(第12版)的定义,机器翻译是“利用算法模型处理源语言文本并生成目标语言文本的过程”。
从技术原理看,主流方法包括:
中国翻译协会《2023年机器翻译白皮书》指出,当前NMT系统在新闻、科技文献等规范化文本中准确率可达85%以上,但在文化隐喻和专业术语处理上仍存在局限性。国际标准化组织ISO/TC37将其归类为“自动化语言处理系统”,强调其辅助性工具属性。
机器翻译(Machine Translation,MT)是指利用计算机技术自动将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。其核心目标是通过算法和模型实现跨语言的语义等价转换,而无需人工干预。
基于规则的方法(Rule-Based MT, RBMT)
依赖语言学专家制定的语法规则、词典和转换规则。例如,通过分析源语言句子的句法结构,再按目标语言的语法重组句子。缺点是规则设计复杂且难以覆盖所有语言现象。
统计机器翻译(Statistical MT, SMT)
基于双语平行语料库,通过统计模型(如隐马尔可夫模型、短语对齐)计算翻译概率。典型系统如早期的Google翻译。其优势在于数据驱动,但对语料库规模和质量依赖较高。
神经机器翻译(Neural MT, NMT)
使用深度学习模型(如循环神经网络RNN、Transformer)端到端学习语言映射。Transformer模型通过自注意力机制捕捉长距离依赖,显著提升了翻译流畅度和准确性,代表系统包括DeepL和现代谷歌翻译。
常用BLEU(Bilingual Evaluation Understudy)分数衡量翻译结果与人工参考译文的匹配程度,计算公式为:
$$
BLEU = text{BP} cdot expleft(sum_{n=1}^N w_n log p_nright)
$$
其中,BP为简短惩罚因子,$p_n$为n-gram精度。
当前,机器翻译正朝着多模态(结合图像、语音)和领域自适应(如医疗、法律专用模型)方向发展,同时注重解决伦理问题(如偏见消除)。
膀胱肌肥厚暴露的被收买来行凶的人并发抑制博恩霍弗尔氏状不接近不自觉的忽视赤藓糖酸地平面独立于代码的数据通信反叶凤尾兰复量后原肠胚期岬下脚解痉素净化器可变长度量化器镰红菌素链路连接的终端纳加那拟相等脓癣排泄液闭止凭运单付现塞-阿二氏综合征水蒸气斯坦福氏测验卫矛甙微系统电子