“新人类”即将诞生,AI迈入造人新时代

算力智库

    人工智能已经可以自动生成以假乱真的人像照片“忽悠”人类了。凭借“对抗神经网络”,人工智能从“学习”和“识别”进化到了“创造”。清华大学计算机系教授、博士生导师邓志东将此技术与深度卷积神经网络、AlphaGo并称为人工智能的三大发展。当然,基于大数据和大计算的人工智能也存在着“先天不足”,至少在理解和“举一反三”方面还有很长的路要走。
    一个颇为无聊的国外网站最近火了。
    这一名为“此人不存在”(ThisPersonDoesNotExist)的网站没有任何界面设计,输入网址后显示的只有一张人像大头照。新奇之处就在于,每次打开或刷新页面,显示的照片都不同,并且都不是真实存在的人物照片。
    换言之,所有照片都是随机“生成”的,而其背后正是人工智能的支撑。可以看出,人工智能已经从“学习”和“识别”,开始进化到“想象”和“创造”。从网站上的照片来看,不仅实现了无限“生成”,而且还生成得不错——人物有男有女,有老有少,不同人种、不同角度、不同表情,甚至还有眼镜和佩饰,可谓以假乱真。
    事实上,赋予人工智能想象力和创造力的,正是被《MIT科技评论》评为2018十大科技突破之一的“对抗神经网络”。
    据《MIT科技评论》介绍,“对抗”是指两个神经网络使用同一个数据集进行训练。其中一个神经网络叫生成网络(the generator),它的任务就是依照所见过的图片来生成新的图片,而另外那个神经网络叫判别网络(the discriminator),它的任务则是判断它所见得图片是否与训练时的图片相似。
    慢慢地,生成网络创造图片的能力会强到无法被判别网络识破的程度。经过训练的生成网络学会了识别并创造看起来十分真实的图片。这项技术已成为过去10年最具潜力的人工智能突破,帮助机器产生可以“忽悠”人类的成果。
    
    生成式对抗网络“创造”出的人像(现实中不存在此人)具有十足“迷惑性”
    更令人惊叹的是,这样的“生成”还不限于图像。清华大学计算机系教授、博士生导师邓志东近日在上海“张江·2019未来产业峰会”上提到:“两个卷积神经网络通过相互对抗,生成超分辨率真实感的原创图像、声音、3D物体或自然时序数据,这给AI带来一种类似于人类的想象力。”
    AI的三大主义与三大发展
    令人叹为观止的人像“创造”背后,必然是对海量原始照片的学习。
    邓志东认为,生物智能的一个主要特征就是学习,而新一轮人工智能的鲜明特点就是学习能力。无论是生物智能还是人工智能,智能的主要特点就是感知能力、认知能力和行动能力。
    追本溯源,智能的这三大特点源自连接主义、行为主义和符号主义。连接主义是生物智能的解剖学基础,即生物神经系统所包含的神经元、神经元的活性及其相互作用。在此之上,行为主义通过奖励/惩罚进行自主学习,强化学习也是人类和动植物行为学习的主要方式。最后,符号主义极大促进了人类的智力发育,尤其是语言的发明成为了人类智能远超其他生物智能的分水岭。
    以“三大主义”为基础,人工智能在最近五六年取得了飞速发展。目前来看,在大数据和大计算的驱动下,深度学习已成为计算机视觉、语音识别与合成、自然语言处理和大数据分析等的主流方法。以深度卷积神经网络为基础的新一代人工智能确实带来了更接近于人类视听觉的感知能力。
    因此,数据驱动的方法已被视为继实验科学、理论模型、模拟仿真之后的第四科学研究范式——数据驱动的科学范式,其如同网络技术,已逐渐变革为一种通用赋能工具。从“互联网+”到“人工智能+”,新一代人工智能已经远远超出了计算机科学技术的范畴。
    大数据和大计算让人工智能迎来了大发展,邓志东总结了人工智能的三大进展。
    首先是深度卷积神经网络令大数据感知智能取得突破性进展。人工智能已经能获得更加接近于人类水平的视听觉感知能力和对文本自然语言的模式分类能力,从而赋能产品、流程和服务体验,引发了技术变革和产业革命。
    这一领域最为人熟知的例子就是自动驾驶,以全球首个自动驾驶商用服务Waymo One为例,其估值已超千亿美元。另外,在医学影像领域,谷歌的人工智能深度卷积神经网络已经可以根据视网膜影像来准确判断一个人的年龄、性别、血压、是否吸烟等,甚至可预测肺癌、乳腺癌等,达到了国际顶级医生的诊断水平。
    其次是超人类水平的AlphaGo引发全社会强烈关注,在此基础上进化而来的AlphaZero更是带来了无需大数据就可自主学习的棋类通用人工智能。AlphaZero经过8小时16.5万次训练,就击败了AlphaGo战胜李世石的版本。
    第三大进展是对抗性神经网络带来了超真实感的想象能力,也就是上述人工智能“创造”人像的案例所表现的。邓志东表示,生成式对抗网络(GAN)是目前最为成功的生成式神经网络模型,通过与强化学习及蒙特卡洛搜索等的结合,推动了半监督与无监督学习方法的发展。
    
    清华大学计算机系教授、博士生导师邓志东
    大数据AI的先天不足
    邓志东坦言,以大数据为燃料,喂食越多,人工智能越能获得更好的感知直觉。但问题随之而来,首先是对大数据的清洗和标签需要付出很高代价。
    其次,在落地应用中,在开放环境下,实际是不存在完备的大数据的。对于各种应用场景,大数据人工智能均只能获得较接近于人类水平的视听觉等感知能力,这与各种基于公开测评数据集得到的性能指标是完全不同的。简言之,人工智能或许在测试状态下表现良好,但在实际落地应用中的表现却可能差强人意。
    此外,基于深度学习的计算机视听觉感知方法不仅依赖大数据的驱动,也缺乏人类举一反三的,基于小样本的学习能力和对目标的认知水平的理解能力,并且缺乏记忆、没有常识、不能运用经验,缺乏技巧和知识学习能力。
    比如,人们开车转弯或掉头就是过程性经验。大脑记住后,每当转弯就不需要再思考,而是可以条件反射地做出动作。
    人类的思维方式并不完全依靠特征提取,很多时候是靠理解和推理,但目前人工智能并不具备这样的能力,也就不具有规划决策和思考能力。
    邓志东把大数据人工智能面临的挑战归结为:人工智能缺乏自己的语言。相比之下,语言却是人类的“制胜法宝”。他表示,人类高层认知能力其实是通过记忆语言去思考和推理的。记忆以及知识的运用,都是基于语言的。
    另外,大数据人工智能的发展,还会带来法律、伦理、隐私安全和失业等方面的挑战。
    尽管当下的人工智能还非常弱,“落地”也只能在特定应用领域发挥作用,还极度依赖大数据。但随着人工智能的进一步发展,也就是认知智能和通用人工智能的发展,或许会对技术与产业带来变革,甚至威胁到人类的安全。
    “但总体来说,现在的弱人工智能对于人类是赋能和有益的”,邓志东表示。
    拥有自己语言的下一代人工智能
    对于人工智能的未来突破点,邓志东认为,关键就在于从感知智能向认知智能的进化。目前人工智能主要追求看清、听清,能够识别但没有理解,属于感知智能范畴。未来人工智能的发展目标将是如何看懂、听懂和读懂,从而具备基本的认知智能,这也是从弱人工智能向通用或强人工智能进化的方向。
    所谓认知智能,就是指对目标或实体具有理解能力,理解事物的内涵和外延。其发展趋势就是要探索举一反三的认知智能,即以大数据感知智能+图模型/知识图谱为基础,利用图卷积神经网络从特征学习拓展到知识学习。
    而通用人工智能则包含了多任务的自主学习、自适应与自组织能力。其发展趋势是基于连接主义的深度神经网络,通过与行为主义的强化学习,特别是与具有学习能力的符号主义的有机结合,从AlphaZero这样的新起点出发,发展出具有更宽垂直领域的通用人工智能。
    总之,通过深度学习与无监督学习、概率或模糊图模型知识图谱进行深度融合,让下一代人工智能拥有自己的语言,并能根据数据和常识自主学习,是探索认知能力与通用人工智能的关键路径之一。