又一项目击败人类，阿里巴巴的AI模型阅读理解精准率超越人类

2024.07.14

    近日，在由斯坦福大学发起的机器阅读理解领域顶级赛事SQuAD中，阿里巴巴凭借82．440的精准率，超越了人类82．304的成绩。
    据了解，SQuAD比赛构建了一个大规模机器阅读理解数据集，其中包含10万个问题，文章来源于500多篇维基百科文章。比赛旨在通过梳理出这套试题的线索，看机器学习模型是否能够经过大量信息处理后给出问题的确切答案。
    阿里巴巴研究院自然语言处理首席科学家司罗在一份公告中说，对于像“天为什么会下雨”这样的客观问题，机器给出的答案准确率会很高。这种语音技术可以逐步应用于诸如客服、博物馆指南、在线解答患者医疗问题等广泛的实际应用领域，从而以一种前所未有的方式减少人力投入的需求。
    这项技术的突破在于最新的“基于分层融合注意力机制“的深度神经网络算法。该模型能够模拟人类在阅读理解问题的一些行为，包括结合篇章内容主体，带着问题反复阅读文章、避免阅读中遗忘而进行相关标注等。
    同时，此项技术已被阿里内部广泛使用。例如，每年双11都有大量的顾客对活动规则进行咨询。阿里会让机器直接对规则进行阅读，为用户提供规则解读服务，完成人机自然交互。
    在此次比赛中，微软程序拿到了82．6分，其他的AI程序虽然没有超过人类标准，但是得分也比较高。例如，艾伦人工智能研究所、腾讯等企业开发的AI。