马年,AI 留给翻译菜鸟的时间真)的不多了

  更新时间:2026-02-16 07:02   来源:牛马见闻

吉报头条
重要新闻
国内新闻
国际新闻
图片精选

读到不少对比 AI/人工翻译表现的论文或文章在比较 AI 与人工译而甚至藐视AI

<p style="text-align:justify;">2025年12月15日,人!工智能领域?核心期刊 IEEE Transactions on Big Data发表一篇深度分析大语言模型(LLM)与人工译者能力边界的研究。</p> <p style="text-align:justify;"></p> <p></p> <p style="text-align:center;"></p> <p style="text-align:justify;">这几年,读到不少对比 AI/人工翻译表现的论文或文章,有些存在明显的逻辑缺陷:有的堆砌几个误译案例便草率定下“机不如人”的结论;有的则把来路不明的 AI 初译与经过多轮审校的人工定稿放在同一维度比较,给人“欺负AI”的不公印象。相比之下,本研究在变量控制与比较参数上更显客观与严谨。</p> <p style="text-align:justify;"></p> <p style="text-align:justify;">研究系统评估了 GPT-4、ALMA-R、DeepSeek-R1 等主流模型,涵盖中-英、俄-英、中-印地语等多个语对,以及新闻、科技、生物医学等专业领域。其研究设计有两个关键点值得关注:</p> <p style="text-align:justify;"></p> <p style="text-align:justify;">1. 译者阶梯分档。研究并未将“人工译者”视为一个模糊的整体,而是将其细化为三个层级:</p> <p style="text-align:justify;"></p> <p style="text-align:justify;">初级译者: 1–2 年从业经验;</p> <p style="text-align:justify;"></p> <p style="text-align:justify;">中级译者:3–5 年经验或以目标语为母语者;</p> <p style="text-align:justify;"></p> <p style="text-align:justify;">高级译者:10 年以上经验且持有国家翻译资格考试(CATTI) 一级/二级(高级)证书。</p> <p style="text-align:justify;"></p> <p style="text-align:justify;">2. 基于 MQM(多维度质量度量框架)的错误率统计。在八组测试中(以每 200 句文本的平均“重大错误”数为例),数据揭示了一个残酷的现实:GPT-4 的平均重大错误数为 3.71,已与初级(3.27)和中级译者(3.30)处于同一量级。 唯有高级译者凭借平均 1.83 个错误率,守住了人类翻译的高地。</p> <p style="text-align:justify;"></p> <p style="text-align:justify;">换句大白话:大多数初中级译者的水平已经被优质大模型追上了,留给翻译新手的缓冲期不多了,而10年以上老译者尚有优势。</p> <p style="text-align:justify;"></p> <p style="text-align:justify;">在比较 AI 与人工译者的表现时,人们常常不自觉陷入一个误区:总是把人工翻译理想化,仿佛人工译者不会犯低级错误。一旦 AI 译错,群嘲似乎理所当然;而人工初译中的种种不堪,却往往被悄然忽略。</p> <p style="text-align:justify;"></p> <p style="text-align:justify;">事实上,人与AI在翻译方面都会犯错,且错误类型也有规律可循。研究进一步揭示了这种差异:</p> <p style="text-align:justify;"></p> <p style="text-align:justify;">LLM 倾向于“过度直译” (overly literal),有时显得刻板;</p> <p style="text-align:justify;"></p> <p style="text-align:justify;">人工译者容易“过度解读” (overinterpretation),尤其在语义模糊处,人类常因“脑补”过度而导致译文偏离原意。</p> <p style="text-align:justify;"></p> <p style="text-align:justify;">换个角度说,“过度解读”本身就是人类思维的长处,只是有时会带来偏离原意的风险。它意味着人工译者能在语境理解上投入更多思考,也正因如此,在高精度需求、文化适配或复杂文学创译任务中,资深译者依然不可替代。</p> <p style="text-align:justify;"></p> <p style="text-align:justify;">当然,“不可替代”并不意味着资深译者可以因此自满,甚至藐视AI。相反,真正值得期待的,是高水平人机协作。</p> <p style="text-align:justify;"></p> <p style="text-align:justify;">以政治文献翻译为例。对于资深译者而言,AI 的进化并非威胁,而是如虎添翼的工具。最近淘了一本老书:《毛选》英译专家程镇球先生的《翻译问题探索:毛选英译研究》(1980年商务印书馆出版)。按程先生的话说,翻译的核心无非是解决“理解与表达”这对矛盾。人工译者在文本理解上有天然优势,而大模型在语言生成上的强项恰能补足表达端的不足。</p> <p style="text-align:justify;"></p> <p></p> <p style="text-align:center;"></p> <p style="text-align:justify;">程先生当年指出《毛选》英译中仍有不少可再推敲之处,而今天借助 AI,许多当年的难点往往能迅速找到更优解(参见知识星球“改稿杂谈”专栏)。另外,语言本身也在不断演变,有些词语经过半个世纪已经变味了,过去合适的表达,今天读来可能显得不合时宜。正因如此,许多经典文本需要不断重译,而在这一过程中,AI 能发挥极好的辅助作用。</p> <p style="text-align:justify;"></p> <p style="text-align:justify;">随着 DeepSeek-R1等具备深度推理能力(Reasoning)的模型崛起,AI 也在逐步提升对语境的把握能力,并在一定程度上弥补逻辑上的不足,这可能是其逼近资深专家的关键。</p> <p style="text-align:justify;"></p> <p style="text-align:justify;">无论从事翻译实践还是翻译研究,这篇来自人工智能视角的论文都值得细读。它不仅提供了更客观的比较框架,也为未来的人机协作模式提供了重要启示。</p> <p></p>

编辑:凯瑟琳·麦克纳马拉