百度全面解析机器同传挑战、前沿与展望


    翻译为人类重新建立交流的巴别塔,机器翻译则让无障碍沟通的门槛降得更低。5月26日,2019自然语言处理前沿论坛上百度人工智能技术委员会主席何中军博士带来“机器同传:进展与展望”的主题演讲,并现场使用了“百度翻译AI同传”这一语音到语音的全新同传产品。
    

    

    据介绍,全新百度翻译AI同传小程序仅需扫码即可使用,同传直播页支持边听边看,体验更实时、流畅。采用云端接入方式,无需传统的同传设备,降低会议成本。此外,会后同传记录还可以一键同步网盘,方便随时查看。
    机器同传:机遇与挑战并存
    机器同传成为人工智能领域前沿研究方向之一。随着语音和机器翻译技术的进步,机器同传取得了较大进展,也面临着一系列挑战:
    挑战一:语音识别错误。由于演讲者的口音、语速以及会场的噪声影响,语音识别通常会存在一定的错误率,这错误会在翻译中进一步放大。解决这一问题,需要从两方面下功夫,一是高质量的语音识别系统,二是具有容错能力、高鲁棒性的翻译模型。
    挑战二:质量与时延的平衡。同传最具魅力的地方在于其低时延,但高质量翻译和低时延之间存在天然矛盾。要想获得高质量的翻译,需要等待演讲者更多的信息,时延就会变长。目前,几乎所有的“实时”翻译系统仍然使用传统的全句(即,非同时的)翻译方法,造成至少一个句子的延迟,使得译文与说话者不同步。
    挑战三:翻译的连贯性和一致性。目前,几乎所有的翻译系统都是以句子为单位进行翻译的,句子与句子之间连贯性较差。同传的主要场景是对演讲者的内容,进行实时翻译,需要保证翻译前后内容的连贯和一致。
    挑战四:训练数据不足。在语音领域,有数十万小时的训练数据;在机器翻译领域,有数十亿句对的训练数据。然而,面向真实场景的同传数据,只有几十到几百个小时,远远不足以训练高质量的同传系统。
    挑战五:评价指标的挑战。在文本翻译任务中,一般根据翻译句子的流利度(语序)和忠实度(完整翻译)对结果进行评价。同传不同于笔译,可以有足够的时间去构思、推敲,同声传译要求译员在极有限的时间内对接受到的信息进行重组,使目的语听众了解原语发言人的讲话内容。因此,会采用“顺句驱动”“合理简约”等方法。传统的评价文本翻译的指标不适用于评价同传的结果。
    
    
    1  2  下一页>