人机辩论赛,IBM的AI战胜人类冠军背后我们该知道些什么?


    故事要从很久很久以前说起……
    我们都知道古希腊人非常擅长辩论,既有含着石头苦练说话的演讲大师德摩斯梯尼,也有百科全书式的人物亚里士多德,更有被誉为“西方孔子”的苏格拉底,那时,思想就是在辩论中产生的。将人工智能引入辩论这一探讨开放性问题的领域非常有趣,受到该灵感的启发,IBM以色列海法实验室的科学家建议设计一个能够与人类辩论的人工智能系统。2012年,ProjectDebater项目正式立项。
    IBM海法研究院ProjectDebater首席研究员NoamSlonim博士(左)和他的同事ProjectDebater全球经理RanitAharonov博士(右)向我们介绍说:“我们在开始这个项目的时候,想的是如果我们确定ProjectDebater能做什么事情,或者说我们非常确定它不能做什么事情,对它能不能实现既定的目标都有百分之百的信心了,这个东西就没劲了。我们想的是语言理解一直都AI领域的重点,也是IBM所关注的一个重点。而且在这个方面的研究实际上是不够的,所以我们希望能够通过ProjectDebater进一步推进在促进AI发展的语言理解领域的研究。”
    6年后,ProjectDebater首次和世人见面。
    人机首次跨“物种”辩论,AI成功逆袭了?
    2018年年中,在IBM美国旧金山的WatsonWest办公室里,首个能与人类进行复杂辩论的AI机器人ProjectDebater分别对阵以色列国际辩论协会主席DanZafrir和2016年以色列国家辩论冠军NoaOvadia,就“是否应当资助太空探索”、“是否增加远程医疗的使用”两大议题展开了激烈的辩论。比赛的规则是1v1,人机双方各有4分钟陈述自己的观点、4分钟反驳对方的观点,以及2分钟进行总结陈词。随后,将根据在场观众的投票数而判断输赢。
    2012年:以色列海法的一个IBM科学家小组开启了ProjectDebater的生命历程,并展开了第一次测试辩论。就像牙牙学语的宝贝一样,开始总是很吃力的。在“体育是否应该作为必修课”这样的话题上,甚至会引用“多个论文表示蜥蜴不会从运动中获得益处”这样的论据:
    2013年:科学家已经开始设想将来ProjectDebater要与真人进行辩论,因此邀请了一位纽约的女配音演员为ProjectDebater配音,赋予了它人类的声音;
    2014年:IBM在第25届国际计算语言学会议上发表了该项目的首篇研究论文;
    2016年:ProjectDebater第一次带着它全新的人类语音,进行实时辩论。ProjectDebater表现很好,但是还会出现不少错误;同年,除了使用维基百科资料以外,项目组还为ProjectDebater添加了来自新闻报道中数十亿的语句,让它获得了更多的论据素材,也因此能就更广泛的话题进行辩论;
    2017年:ProjectDebater取得了标志性的突破——它第一次成功说服人类同意了它的观点!同年,在2017年自然语言处理顶级会议的第4期论辩挖掘研讨会上,来自海法和都柏林的IBM科学家发表了新成果,形成共计30余篇论文和10余个公开的数据集。
    2018年:ProjectDebater首次公开与人类专业辩手进行辩论,一鸣惊人!
    在长期积累下,IBM研究院ProjectDebater团队成员,在各个研究领域发表了30多篇论文,其中最突出的就是提出计算辩论(ComputationalArgumentation)这一迅速崛起的领域。期间提出的多个突破性的算法、工具、流程、框架等研究成果,推动了包括独特的自然语言处理(NLP)、机器学习和推理技术等多个关键技术的进步。研究ProjectDebater过程中取得的技术研究成果,对于其他应用类似技术的人工智能场景会有极大的推动作用。而这些技术的应用,对于ProjectDebater能够跨不同领域和数据集进行学习,从而产生新的知识和理解起了关键作用。
    在这些尖端技术的武装下,ProjectDebater被IBM研究员团队赋予了3大核心能力:包括数据驱动的演讲内容撰写和表达能力,在演讲中识别人类口语中的关键声明概念和观点的听力理解能力,以及通过模拟人类困境来提出制定原则性论点据辅助人类决策的能力,这无疑是人工智能的一次突破性的。
    也就是说,ProjectDebater具有非常强大的数据处理能力,拿到辩题后,它会迅速扫描其庞大的语料库文档中与主题相关的数百万篇新闻和论文等材料,找出与辩题相关性最高的观点,通过算法剔除多余且重复的信息,提取出一个最具说服力的观点加以阐述。
    只要包含上亿篇主流报纸、杂志文章的语料库中有大量的相关内容,ProjectDebater可以针对不同话题进行辩论,提出独具一格的观点。而针对具体的行业或细分的领域,比如金融、法律和公共政策等等,我们的科学家都可以向ProjectDebater添加语料库文档,不断丰富ProjectDebater的“知识面”。
    换句话说,只要有足够的语料库,ProjectDebater就有能力针对任何一个话题提出见解。虽然,目前距离真正掌握人类语言还有一定距离,但这将是人工智能发展的下一座里程碑——真正掌握语言,帮助人类更好地做出关键决策!
    即使不能够彻底替代人类,但可以确信的是机器可以帮助人类更好地做决策。
    和任何发展初期的新技术一样,ProjectDebater还只是迈出了第一小步而已,但没有什么能够阻挡技术的发展,因为我们坚信它的价值——辩论丰富了决策制定的过程,可以帮助我们权衡新想法、新理念的利弊。人类辩论不只是为了说服他人认可我们的观点,也是为了理解和学习彼此的观点,拓展我们的思维,打破刻板观念。未来,相信机器可以帮助人类更好地权衡利弊,推翻偏见,做出更多“无偏颇”的决策。
    AI将如何辅助人类做出更“无偏颇”的决策?
    得益于ProjectDebater庞大的语料库,可为决策提供更多有价值的信息,这些信息对于制定决策往往起到关键作用。因为人做决定时,或多或少都会受到自身经验的束缚,难免先入为主,有失偏颇。而机器则可更全面地收集信息,更中立地分析问题,为决策者提供更多维度的意见参考。未来ProjectDebater的应用潜力不可限量,尤其是商业价值,潜在用途可能且不限于以下领域:
    金融顾问:训练ProjectDebater来找出金融事实,用以支持或反对金融分析师所思考的金融投资选择。
    律师:通过ProjectDebater的汇总技术,律师可以借助ProjectDebater来寻找相关案件和主张,或借助ProjectDebater模拟法庭辩论来分析优势和劣势。
    公共事务决策:通过ProjectDebater公正的优/缺点分析和对人类困境的模拟,可以就需要进行决策的问题,提供基于事实、没有人为偏见的观点。
    学生助手:通过ProjectDebater帮助各个年龄段的学生改进他们的批判性思维和沟通技巧,或帮助他们找出更多信息以改进报告和论文。
    CEO和高管:高层领导常常因拥有强烈的“直觉本能”而感到自豪,但是他们也必须避免所谓的“锚定偏见”。锚定偏见是指,我们在潜意识中有着两三个会不太客观地影响决策的事实时,就会将不适合这些观点的有价值信息排除在外不予考虑。ProjectDebater可以拓宽高层领导的思路,在关键决策中纳入他们可能没有考虑到的新观点。
    以色列国际辩论协会主席DanZafrir与ProjectDebater公开“对决”(图片来自IBM)
    或许,辩论仅仅是AI的一个开始。让AI系统地掌握人类语言,帮助人类在各个领域做出更好的决策,才是AI科学家一直想突破的下一个边界。未来,AI可能做到像人一样具备真正的逻辑推理能力,当我们在各个领域面临复杂问题难以决策时,AI可以帮助人类做出更好的决策。
    IBM海法研究院AITech副总裁AyaSoffer博士近日在回答中国记者提问时说:“关于AI的下一步,就是智慧上越来越接近人类。我觉得ProjectDebater是一个很好的例子,它展示了我们是如何教授机器,只要有充足的时间、充分的数据和算法就可以充分前进。”
    不仅如此,为了让ProjectDebater的表述更加自然,科学家们还教会了它“抖包袱”。例如:“今天有许多利害攸关的事情,对我来说尤其如此,但我不能热血沸腾,因为我没有血液”,“刚刚你的语速已经达到了惊人的每分钟218个字,你没有必要这么着急!”
    那ProjectDebater是怎么学会讲段子的呢?项目组的科学家说,就像人们讲笑话一样,也是先听到了好笑的段子记下来,然后下次再讲给别人听。科学家们依法炮制,给了ProjectDebater很多幽默的素材,并教它在适当的时机“抖包袱”,从而调节辩论的气氛。不过,就像人一样,Debater有时候也会在不合时宜的时候开玩笑。