第三代AI的“大”机遇

2024.04.26 学术头条

    近年来，人工智能（AI）依靠深度学习、计算机视觉、自然语言处理等技术突破与落地应用，不断颠覆着人类的既有认知——AlphaGo 通过自我强化学习击败了人类的顶尖围棋选手；而近日 Alphafold 更是破解了一项过去 50 年生物学领域的重大挑战——蛋白质分子折叠问题。
    自 1956 年 AI 的概念首次被提出后，AI 至今已有 60 多年的发展史。如今，随着相关理论和技术的不断革新，AI 在数据、算力和算法“三要素”的支撑下越来越多地走进我们的日常生活，比如我们常见的语音识别、人脸识别和机器翻译等，都已经在手机、电脑等智能设备上有所应用。
    但是，这一系列惊喜的背后，却是大多数 AI 在语言理解、视觉场景理解、决策分析等方面的举步维艰：这些技术依然主要集中在感知层面，即用 AI 模拟人类的听觉、视觉等感知能力，却无法解决推理、规划、联想、创作等复杂的认知智能化任务。当前的 AI 缺少信息进入“大脑”后的加工、理解和思考等，做的只是相对简单的比对和识别，仅仅停留在“感知”阶段，而非“认知”，以感知智能技术为主的 AI 还与人类智能相差甚远。
    究其原因在于，AI 正面临着制约其向前发展的瓶颈问题：大规模常识知识库与基于认知的逻辑推理。而基于知识图谱、认知推理、逻辑表达的认知图谱，则被越来越多的国内外学者和产业领袖认为是“目前可以突破这一技术瓶颈的可行解决方案之一”。
    目前，人工智能的发展经历了从表示、计算到感知两个阶段，下一个阶段的核心是认知。早在 2016 年，中国科学院院士、清华大学人工智能研究院院长张钹就提出了第三代 AI 体系的雏形，并于 2018 年底正式公开第三代 AI 的理论框架体系，其核心思想为：建立可解释、鲁棒性的 AI 理论和方法；发展安全、可靠、可信及可扩展的 AI 技术；推动 AI 创新应用。
    2019 年，图灵奖得主约书亚·本吉奥（Yoshua Bengio）在 NeurIPS 大会上也指出，深度学习应该以感知为主向，向基于认知的逻辑推理和知识表达的方向发展，这个思想和张钹院士提出的第三代 AI 的思路不谋而合。

    图｜ AI 的发展阶段
    如今，第三代 AI 的理念在国内外获得广泛影响力。业内普遍认为，认知智能将是进一步释放人工智能产能的关键。而认知图谱是实现认知智能技术突破的关键，不仅可以让机器理解数据本质，还可以让机器解释现象本质。
    认知图谱：实现认知智能的关键
    机器认知智能的发展过程本质上是人类脑力不断解放的过程，是人工智能的最高阶段。但是，让机器具备认知智能，其核心就是让机器具备理解和解释能力。这种能力的实现与大规模、结构化的背景知识是密不可分的。
    尽管目前的智能系统在感知方面已经达到甚至超越人类水平，但在鲁棒性、可解释性、安全可靠等方面还存在很多不足。比如，模型鲁棒性差，难以与准确性共生；模型可解释性差，对于可靠性要求高的任务很难胜任；缺乏积累知识的能力，也没能和人类已有的知识体系进行很好的关联，缺乏可靠的推理方法。

    认知图谱旨在结合认知心理学、脑科学和人类知识等，研发融合知识图谱、认知推理、逻辑表达的新一代认知引擎，支持大规模知识的表示、获取、推理与计算的基础理论和方法，实现人工智能从感知智能向认知智能的演进，建立可解释、鲁棒性的认知智能。
    作为一种实现机器认知智能的底层支撑手段，认知图谱在电商平台、智慧城市、司法行业、金融行业、安防行业、大数据的精准与精细分析、智慧搜索、智能推荐、智能解释、自然人机交互等方面具有极为重要的作用。
    认知图谱的历程发展可以追溯到语义网络（Semantic Network）。1968 年，M． Ross Quillian 在研究人类长期记忆模型时，描述了人类长期记忆的一般结构模型，认为记忆由概念之间的联系来实现，并存储在复杂的网络中，并基于此提出了语义网络的概念。
    同年，专家系统之父、图灵奖得主爱德华·费根鲍姆（Edward Feigenbaum）等人研发出了世界首个专家系统 DENDRAL。专家系统是早期 AI 的一个重要分支，它可以看作是一类具有专门知识和经验的计算机智能程序系统，一般采用 AI 中的知识表示和知识推理技术来模拟通常由领域专家才能解决的复杂问题。
    1998 年，万维网之父、ACM 图灵奖获得者蒂姆·伯纳斯－李（Tim Berners－Lee）爵士也提出了语义网的概念，其核心理念是通过给万维网上的文档（如：HTML 文档、XML 文档）添加能被计算机理解的语义“元数据”（Meta Data），使整个互联网成为一个通用的信息交换媒介，即用知识表示互联网，建立常识知识库。
    2006 年，蒂姆·伯纳斯－李提出链接数据（Linked Data）的概念，表示数据不仅仅发布于语义网中，还要建立起数据之间的链接，从而形成一张巨大的链接数据网，其目的是构建一张计算机能理解的语义数据网络，而不仅仅是人能读懂的文档网络，从而在此之上构建更智能的应用。
    2012 年，Google 的阿米特·辛格尔（Amit Singhal）等人介绍了知识图谱（Knowledge Graph）的概念。知识图谱以语义网络的结构化方式描述客观世界中概念、实体、事件以及它们之间的关系，相对于传统的本体和语义网络而言，实体覆盖率更高，语义关系也更加复杂而全面。

    图｜认知图谱的演化历程（来源：报告《人工智能之认知图谱》）
    但是，要让机器具备认知智能，其核心就是让机器具备理解和解释能力，这种能力的实现与大规模、结构化的背景知识是密不可分的。2020 年，清华大学计算机系教授、系副主任唐杰在“人工智能下一个十年”报告中，结合认知科学和计算机理论，提出了一个实现认知智能的可行思路，即“认知图谱＝知识图谱＋认知推理＋逻辑表达”，并希望利用知识表示、推理和决策，以及人的认知来解决复杂问题。
    这个思路的基本思想是结合认知科学中的双通道理论：人脑的认知系统中存在两个系统，即 System 1 和 System 2。System 1 是一个直觉系统，它可以通过人对相关信息的直觉匹配寻找答案，非常快速、简单；而 System 2 是一个分析系统，它通过一定的推理、逻辑找到答案。比如，回答一个具体问题：2003 年在洛杉矶 Quality 咖啡馆拍过电影的导演是谁？
    要回答这一问题，首先需要 System 1 找到相关的影片，然后 System 2 做出决策，如果是标准答案，就结束整个推理过程；如果不是，而相应的信息又有用，就把它作为一个有用信息提供给 System 1，System 1 继续做知识扩展，System 2 则再次做出决策，直到找到最终答案。
    由此可见，认知图谱的核心是以实现融合知识驱动和数据驱动相结合的知识表示和推理的认知引擎为目标，研究支持鲁棒可解释人工智能的大规模知识的表示、获取、推理与计算的基础理论和方法；建设包含语言知识、常识知识、世界知识、认知知识的大规模知识图谱以及典型行业知识库，建成知识计算服务平台。
    机遇与挑战并存
    近年来，虽然 AI 已经取得了快速发展，但如何将深度学习与大规模常识知识结合起来，实现认知推理与逻辑表达，还面临着很大挑战。
    研发融合常识知识图谱、认知推理和逻辑表达等核心技术的认知图谱将成为实现下一代 AI 技术突破的关键，实现以认知图谱作为底层数据支撑，具有推理、具有可解释性、具有认知的新一代 AI，是 AI 领域下一个 10 年重要的发展方向，也是一个机遇与挑战并存的发展方向。
    众所周知，技术的突破与发展离不开来自人才的持续创新，科技竞争归根结底也是人才的竞争。那么，放眼中国乃至全世界，认知图谱领域的人才在哪里？
    近日，清华大学人工智能研究院、北京智源人工智能研究院、清华－中国工程院知识智能联合研究中心、阿里集团－新零售智能引擎事业群联合发布了《人工智能之认知图谱》（Research Report of Cognitive Graph）报告（文末福利，免费下载完整版报告）。该报告依托 AMiner 平台，对技术领先的国家、机构和学者，以及认知图谱相关领域的技术发展趋势、技术创新热点等进行了详细分析。
    数据显示，全球范围内认知图谱相关领域的学者主要集中在北美、欧洲和亚洲。美国的高水平学者数量在全球位居首位，其次是中国，第三是英国。
    其中，中美两国的高水平学者数量远高于其他国家，在认知图谱相关领域具有较强的发展潜力。中国虽然仅次于美国，但是高水平学者数量约是美国的一半，相差较大。

    图｜ h－index TOP 5000 全球学者的国家统计前 10 名
    而国内认知图谱相关领域学者主要分布在中国的经济和政治发达地区，包括京津冀、长江三角洲、珠江三角洲、香港、台湾等地区，中部、西部和东北地区的学者则相对较少。
    具体而言，北京、上海和江苏的认知图谱相关领域学者数排名前三位，分别为 129、45 和 36。（参考 h－index 作为筛选条件，选择 TOP 5000 全球学者以地图形式展示和分析学者的地区分布，其中颜色越红、圆圈越大，表示人才越集中。）

    图｜ h－index TOP 5000 中国学者的省市统计前 10 名
    而且，美国在认知图谱相关领域的论文发表量和总被引频次、高水平学者数量均位居世界前列。中国虽然在论文发表量和高水平学者数量方面仅次于美国，但与美国差距较大，并且论文总被引频次要低于英国和德国，在全球排名第四。

    图｜论文总被引频次排名前 10 的国家
    此外，报告还基于 AMiner 平台将学者流入和流出数量之和作为筛选条件，统计了认知图谱相关领域的全球学者在2009年—2020年间的流动数量排名前 10 的国家。
    数据显示，美国、加拿大、法国的学者流入数量大于流出数量，而中国、英国、德国、意大利、印度、日本、西班牙的学者流出数量大于流入数量。

    图｜全球认知图谱领域学者的流动情况（来源：报告《人工智能之认知图谱》）
    由此看出，中国近 10 年来的学者流动较为频繁，这与中国制定的出国培养、人才引进等相关人才政策不无关系。随着经济全球化深入发展，科技人才的跨国流动更加频繁，各国对科技人才的争夺更加激烈。
    那么，国内认知图谱相关领域的学者分布情况又如何呢？
    数据显示，北京是学者流入和流出数量都很高的城市，比其他城市高出较多，这可能与北京的高校和科研院所数量较多有一定关系。此外，北京、香港、上海、哈尔滨的学者流出数量高于流入数量，而武汉、南京、西安、杭州、广州、合肥的学者流入数量高于流出数量。北京、香港、上海的学者流失与这三个城市的高校数量较多、供求关系不平衡、人才竞争力和生活压力较大不无关联，而哈尔滨的地域环境造成了一定的学者流失。针对学者净流入数量为正值的这几个城市，通过调研相关资料，可以发现这些地方在积极推行人才引进政策，包括落户、房补、薪酬等方面均制定了相应的优惠措施。

    图｜中国认知图谱领域学者的流动情况（来源：报告《人工智能之认知图谱》）
    以上分析表明，在下一代 AI 的机遇与挑战下，中国相关部门需要重视并采取相关措施，让中国学者在重视论文数量的同时，也要提升论文质量，同时也要加快高水平科技人才队伍的建设，一方
    针对国际新局势从政策、资金、资源等多个方面加快本土培养，另一方面加大力度引进国外重要机构的杰出学者，改善人才结构，加速认知图谱领域的技术发展。
    未来 10 年，具有推理、具有可解释性、具有认知的新一代 AI，是 AI 领域的下一个重要发展方向，而研发融合常识知识图谱、认知推理和逻辑表达等核心技术的认知图谱将成为实现下一代 AI 技术突破的关键，但归根结底还要依靠相关人才基于不懈努力做出的创新。