机器翻译真的可以取代翻译员的工作吗？

2024.07.08 科多大数据

我们生活常用的机器翻译成为翻译活动中的重要的辅助工具。而机器翻译错译、死译频出，给翻译工作带来诸多不便。近年来，“大数据”的出现为机器翻译带来了新希望，其独特的“4V”特点将对机器翻译产生革命性的影响。科多大数据带大家来看看大数据在机器翻译中的应用是怎么样的。

大数据，即大量的数据，在一定程度上可以理解为多个大语料库的结合体。维克托·迈尔提出大数据有容量大、种类多、速度快和价值高四大特征。容量大、种类多保证了它为译者提供一个包含各种资源的巨型共享资料库；速度快、价值高可提高翻译的效率和精确度。译者要意识到大数据共享资源的重要性，充分利用其来查找翻译所需的相关资源。

    大数据时代，利用信息技术进行辅助翻译是翻译工作者一项必备技能。经济全球化快速发展带来各国交流频繁，各种翻译应接不暇，利用信息技术进行辅助翻译是大势所趋。下面主要围绕两种辅助翻译工具展开：塔多思与谷歌。
    Trados是一种翻译记忆软件。它将译员做过的工作用Trados提供的工具存储起来，放到两个主要的数据库中：句料库和术语库。Trados基于数据库原理，利用翻译记忆，将已译资源以句子为单位存入数据库，翻译时系统自动对源语言文本进行分析，与数据库中的翻译记忆进行匹配，100％匹配的句子可自动替换；部分匹配的句子根据匹配度提出翻译建议；全新的句子可通过系统提供的建议进行人工翻译；而每一次翻译又作为新翻译记忆积累入数据库。这样将机器与人工相结合就帮助译者提高了翻译效率和准确性。Trados能够自动替换日期、时间和度量单位等，如句料库中有2008年5月，译文中出现May，2017时就会自动替换为2017年5月。
    谷歌翻译使用的是基于统计的翻译方法，所有语言知识都是从语料库中自动获取，通过概率模型对语料库中的句子进行概率计算后生成。来自互联网的几乎所有语言文本，构成了谷歌的庞大的语料库。谷歌翻译还利用网络资源不断补充和更新。所以在谷歌翻译中输入源语言文本后，系统会根据概率模型对语料库中的句子进行概率计算搜索出最优化和使用频次最高的译文，如输入“Nopains，nogains．”，便会生成译文“不劳则无获。”

    （一）优势
    大数据时代，基于平行语料库，翻译多样性和准确性成为可能。语料库帮助提供真实语料、提供统计数据、验证现行的理论、构建新的理论。例如，红楼梦中前80回出现了1219个“某某笑道”，该如何翻译呢？全译为smiledandsaid，不仅重复，而且抹去了经典名作的文学特色。这时译者可以借助大数据的优势，查询smile的平行词找到chuckle，giggle，grin等或通过网络向英语母语朋友和高人请教，再根据人物特点和上下文选择适当译文。使用翻译记忆软件可以让众多译员共享网络术语库，避免重复工作，降低翻译成本，节省时间和精力，保持上下文术语前后一致，从整体上提高了翻译效率和质量。而且谷歌本身作为搜索引擎，为其语料库内容的充实和更新提供了便利条件。
    （二）局限
    大数据时代下的机器翻译给人们带来了诸多便利，但也有其局限性。
    一，译文好坏受到平行语料库数据大小和领域的制约。由于语言规则复杂，样本信息必须足够大才能有好的效果。
    二，运用Trados进行翻译时极大地依赖于翻译记忆，若翻译记忆资源中有误，翻译记忆的质量和数量都会影响译文准确度。
    三，基于大数据的翻译方法并不涉及规则，尤其是语法规则，机器翻译不能识别语法信息，降低了译文的可理解度。如输入Ahorsestumblesthathasfourlegs时，谷歌翻译给出的译文是“马绊倒有四条腿”。
    四，基于大数据的翻译抑制了译者的创新思维，译者只会搜索而不是自己思考，或许会有更好的译文也说不定。
    五，在翻译带有情感的源语言时，机器并不能像人那样发挥译者的主体性，给出合适的最符合语境的翻译，体现不出原文人物内心的感情色彩，在描写人物的心理变化方面明显不足。
    六，机器翻译无法处理多义词。输入的源语言文本内容并不一定能够百分之百地在语料库中匹配到对应的内容。
    七，机器不能考虑源语言的文化背景上下文等，不能选择最恰当的译法。
    尽管已取得巨大进步，机器翻译也有不足之处。总之，在大数据时代下，计算机翻译工具只是一种辅助工具，最根本的还是要发挥译员的主体性作用，在不断改善翻译记忆库中所储译文质量和数量情况下，机译结合人译，才能更好地做好翻译工作。
    相信大家都知道打铁还需自身硬，我们要巩固好自身的大数据技术，才能更好的应用在产品中并不断的优化完善，改善我们的生活。更多大数据与人工智能的相关学习资讯关注公众号成都科多大数据即可免费获取。