
【計】 machine translation; mechanical translation; MT
機器翻譯(Machine Translation, MT)指通過計算機程式自動将一種自然語言轉換為另一種語言的技術。其核心目标是實現跨語言信息傳遞,降低人工翻譯成本。根據《牛津英漢雙解詞典》(第12版)的定義,機器翻譯是“利用算法模型處理源語言文本并生成目标語言文本的過程”。
從技術原理看,主流方法包括:
中國翻譯協會《2023年機器翻譯白皮書》指出,當前NMT系統在新聞、科技文獻等規範化文本中準确率可達85%以上,但在文化隱喻和專業術語處理上仍存在局限性。國際标準化組織ISO/TC37将其歸類為“自動化語言處理系統”,強調其輔助性工具屬性。
機器翻譯(Machine Translation,MT)是指利用計算機技術自動将一種自然語言(源語言)轉換為另一種自然語言(目标語言)的過程。其核心目标是通過算法和模型實現跨語言的語義等價轉換,而無需人工幹預。
基于規則的方法(Rule-Based MT, RBMT)
依賴語言學專家制定的語法規則、詞典和轉換規則。例如,通過分析源語言句子的句法結構,再按目标語言的語法重組句子。缺點是規則設計複雜且難以覆蓋所有語言現象。
統計機器翻譯(Statistical MT, SMT)
基于雙語平行語料庫,通過統計模型(如隱馬爾可夫模型、短語對齊)計算翻譯概率。典型系統如早期的Google翻譯。其優勢在于數據驅動,但對語料庫規模和質量依賴較高。
神經機器翻譯(Neural MT, NMT)
使用深度學習模型(如循環神經網絡RNN、Transformer)端到端學習語言映射。Transformer模型通過自注意力機制捕捉長距離依賴,顯著提升了翻譯流暢度和準确性,代表系統包括DeepL和現代谷歌翻譯。
常用BLEU(Bilingual Evaluation Understudy)分數衡量翻譯結果與人工參考譯文的匹配程度,計算公式為:
$$
BLEU = text{BP} cdot expleft(sum_{n=1}^N w_n log p_nright)
$$
其中,BP為簡短懲罰因子,$p_n$為n-gram精度。
當前,機器翻譯正朝着多模态(結合圖像、語音)和領域自適應(如醫療、法律專用模型)方向發展,同時注重解決倫理問題(如偏見消除)。
按責任報告不公正的人常量應變詞彙特征達科斯塔氏綜合征改建費用黃烷酮醇假門尼粘度繼電器控制系統結算外彙單機構性組織警察訓練學校經綸開支稅克萊恩氏夾髋臼下的林内氏試驗拟指令評價技術輕性持續性癫痫丘腦被蓋的确定性語言理論任性的糁散器上骨壺腹雙親的條件名同時替換