谷歌与DeepMind:史上最强人工智能拉锯战


    2010年奇点峰会,DeepMind创始人Demis Hassabis在会上发表了关于AGI的演讲,演讲题目是:建立AGI的系统神经学方法。
    AGI指通用人工智能,它是一种假设的计算机程序,可以和人类一样执行智能任务,甚至有希望超越人类。AGI将能够完成离散的任务,比如识别照片或翻译。此外,它将会加减运算、下棋、说法语,还能理解物理论文、撰写小说、设计投资策略、与陌生人谈话。它将能够监测核反应、管理电网和交通流量,它可以轻易地做任何事情。相比之下,目前最先进的AI在AGI面前看起来就简单得像个便携式计算器。
    上述任务目前只能由人类完成。但是人类智力受到脑容量所限,更受人类渺小脆弱的身体限制。既然AGI在计算机上运行,它就不会受到这些机体条件限制,其智能水平只受处理器数量的影响。AGI可能会先从监测核反应开始。但很快,它在一秒内消化的物理论文数量比一个人在千年内消化的还要多,并可以据此发现新能源。人类智慧,再加上计算机的速度和可扩展性,将解决目前看来无解的问题。Hassabis预计AGI将掌握各种学科,包括癌症研究、气候变化、能源、基因组学、宏观经济、金融系统等等。
    AGI将高速地处理信息且高度智能,不断自我改进的系统将急剧提升机器智能程度。但是AGI的未来难以预测,没人知道这一切是好是坏。
    Hassabis解释说,到目前为止,科学家们一直从两个途径发展AGI。第一个途径是符号AI。研究人员试图描述编写一套完整的规则,使之能像人类一样思考。这种方法在上世纪八九十年代很流行,但没有达到预期的结果。Hassabis认为,人类大脑神经结构太过微妙,编程模仿是做不到的。第二个途径是以数字形式复制大脑的生物网络。这听起来似乎可行,毕竟大脑是人类智力的中心。但操作起来并不现实,因为这么做就好比绘制宇宙中每一颗恒星的地图。最根本的问题在于,这种途径是在错位研究大脑功能。打个比方,这就像试图通过打开计算机并检查晶体管的交互来理解Microsoft Excel是如何工作的。
    Hassabis提出了中间立场:AGI应该从大脑处理信息的广泛方法中汲取灵感,而不是在特定情况下应用生物系统或特定规则。换句话说,它应该专注于理解大脑的软件运作,而不是大脑的硬件构成。功能性磁共振成像等新技术使人们能够在大脑活动的同时观察大脑内部,因此理解“大脑的软件运作”渐渐成为可能。最新研究表明,大脑通过在睡眠中重演经验来学习,从而得出一般原则。AI研究者应该模仿这种系统。
    当年Hassabis参加奇点峰会最重要的目的是募资,DeepMind最终获得200万英镑投资,其中著名风险投资人彼得·泰尔投资了140万英镑。谷歌在2014年1月以6亿美元收购该公司时,Thiel和其他早期投资者的投资回报率高达5000%。
    对许多创始人来说,这已经算是一个完美的结局。但对Hassabis来说,被谷歌收购只是他追求AGI过程的一个步骤而已。 2013年,他花费大量时间进行协议条款谈判,目的在于保持DeepMind的独立性。它可以获得被谷歌收购的好处,比如获得现金流和计算能力,但是创始人仍然保有对公司的控制权。
    Hassabis认为DeepMind具备多种优势:拥有创企的动力、顶尖大学的优异人才、大公司的财力支持。可谓万事俱备,因此AGI的时代会加速到来,从而为人类造福。
    天才游戏少年
    Demis Hassabis 1976年出生于伦敦,他4岁开始下国际象棋,13岁时成为了世界上同年龄段中位列第二的棋手。8岁在老式电脑上自学编程。1992年提前两年完成高中课程。他在Bullfrog Productions找到一份电子游戏编程的工作,编写的虚拟游戏Theme Park大卖1500万张拷贝。
    十几岁的时候,Hassabis同时参加国际象棋、拼字游戏、扑克和西洋双陆棋的比赛。1995年,在剑桥大学学习计算机科学时,又参加了学生围棋锦标赛且成绩出色。下棋激发了Hassabis对人工智能的兴趣。当他下棋时也在思考,计算机是否也可以像人类一样通过经验积累不断学习。游戏提供了脱离现实的完美学习环境。游戏世界纯粹又包容,玩游戏不会受到干扰而且可以迅速掌握。
    先搞定智能,其它问题就能迎刃而解
    1997年5月,IBM超级计算机Deep Blue击败了国际象棋世界冠军Garry Kasparov。这是计算机首次击败一位大师级棋手。这场比赛受到广泛关注,也引起了人们对计算机不断增长的力量和潜在威胁的担忧。当时Hassabis产生了一个想法,他要把战略游戏和AI结合起来,有一天,他会建立一个计算机程序,打败最高段位的人类围棋手。
    Hassabis有条不紊地规划职业生涯。1998年,他创办了自己的游戏工作室Elixir,专注开发一款复杂的模拟政治游戏Republic: The Revolution。还在学校时,Hassabis就有这样的想法:通过超级计算机来模拟复杂的世界动态,以解决最棘手的社会问题。当时,他试着在游戏中实践自己的想法。不过现实很骨感,Elixir最终发布了精简版的游戏但是反响平平。其它游戏也没有成功。2005年4月,Hassabis关闭了Elixir。有人认为Hassabis创立Elixir只是为了获得管理经验。现在,在正式踏上AGI之路以前,他只缺少一个关键的知识领域——了解人类的大脑。
    2005年,Hassabis在伦敦大学学院开始攻读神经科学博士学位。他发表的关于记忆和想象力的研究很有影响力。一篇被引用上千次的论文显示,患有健忘症的人也很难想象新的体验,这表明记忆和创造大脑图像之间存在联系。Hassabis所作的研究都是朝着AGI迈进。他大部分研究都回归一个问题:人脑是如何获得并保留概念和知识的?
    2010年11月15日,Hassabis正式成立DeepMind。从那时起,公司的宗旨就一直没有变过:先搞定智能,其它问题就能迎刃而解。也就是说,把大脑如何完成任务的理解转化为计算机软件,软件可以使用相同的方法进行自我学习。
    Hassabis并没有假装科学已经完全理解了人类的思想。AGI的蓝图不能简单地从数百项神经科学研究中得出。我们对大脑的功能仍然知之甚少。2018年,Hassabis自己的博士研究结果甚至受到了澳大利亚研究团队的质疑。所以DeepMind的起步工作还是很艰难。
    Suleyman和Shane Legg加入了公司联合创始人的行列。公司位于伦敦,许多新员工来自欧洲,有效避开了和谷歌、Facebook等硅谷巨头争夺人才。也许DeepMind成功秘诀之一就在于留住了最优秀的员工。
    公司花大力气发展的一种机器学习技术——强化学习,源于Hassabis所擅长了两个领域:游戏和神经科学。建立这样一个程序是为了收集有关其环境的信息,然后通过重复经验来从中学习,就像Hassabis所说的“睡眠期间大脑活动”一样。
    在此之前,强化学习在计算机领域还是一片空白。程序显示了一个虚拟环境,除了游戏规则,它什么也不知道。程序包含至少一个称为神经网络的组件。由计算结构层组成,可筛选信息,目的是识别特定特征或策略。每一层都在不同的抽象层次上检查环境。起初,这些网络的成功率很低。当他们尝试不同的策略时,变得越来越老练,当成功时,也会得到奖励。程序不会再次范同样的错误。AI神奇的地方就在于它重复任务的速度。
    DeepMind的AI项目在2016年获得重大胜利,当年,AlphaGo在首尔举行的五局三胜比赛中击败围棋世界冠军,震惊世人。2.8亿人见证了AlphaGo的胜利,有专家曾预测人机对战机器取胜还需要十年时间。次年,升级版AlphaGo击败了中国围棋冠军。
    
    
    1  2  下一页>