中国人工智能产业白皮书全文(上)


    目前,一场技术革命正席卷全球,抓住该机遇的国家将主宰21世纪。没有哪个领域对大众生活、生计、安全以及繁荣稳定的变革力比得上人工智能(AI)技术。人工智能将改变全球经济和国际关系的力量平衡,因为首先掌握人工智能技术的国家在制定下一个全球秩序方面将具有关键性战略优势。
    
    就像任何变革性技术一样,很难打破人工智能的炒作嫌疑。记者和专家可以重点突出最重要的新兴趋势和行业问题,比如人工智能和人工智能驱动的自动化改变劳动力市场时可能产生的政治影响。毕竟,即使技术变革带来了就业总人数的净增长,也会使大批缺乏教育和培训的劳动者失业。这一现实将使各国政府更难以满足每个公民的需求。但人工智能的观点及其含义有可能混淆不同类型人工智能、以及政府对其判断。日前,全球最大政治风险咨询公司亚欧集团(Eurasia Group)联合世界领先的AI研究者兼“创新工场”(Sinovation Ventures)创始人李开复,发表了有关中国人工智能领域的白皮书。
    当前的共识是,美国和中国已经开始了双向的AI主导竞赛。在全球决策者和立法者讨论美国在全球未来地位的时候,白宫和硅谷之间的气氛日益紧张,而中国则开始大力发展AI。尽管中国在顶级硬件和人才方面仍然落后于美国,但其互联网用户数量超过了美国和欧洲的总和,这一优势可以使中国在积累大量数据的过程中拥有不可磨灭的领先优势,而这些数据则是人工智能创新的核心。但是,美中竞争是两国关系的中心因素,这不仅仅是一场胜者全得博弈。随着中国不断缩小在人工智能方面的差距,对这个领域的仔细研究也显示了该超级大国与新兴挑战者之间更多的异化。
    除了这两个大国之外,许多大小国家的决策者现在都在努力应对人工智能问世带来的机遇和挑战。虽然这样一来可能会导致贸易摩擦加剧,并引起人工智能在短期内会对国家安全造成危害的担忧;但从长远来看,人工智能、自动化和相关技术将是未来公民安全和繁荣的关键。
    中国的人工智能变革:了解北京的结构性优势
    如果2017年中国AI产业只是“预热和炒作”,那2018年中国在AI领域的优势才将真正体现。媒体关于中国人工智能崛起的报道大部分集中在中国大型互联网公司、人工智能的部署、政府对该技术的高度兴趣、以及美中“AI战”的可能性。关于后者的讨论往往涉及对人工智能潜在的军事用途的警告,以及人们对杀手机器人的过分担忧。
    这些分析在许多方面令人失望。它们通常无法区分AI的不同含义,AI如何被使用,以及如何将AI用于为各种应用软件增添智能功能等。本白皮书试图解决这种不平衡问题,首先通过对中国AI多种表现形式提出更加细致的观点,然后概述中国人工智能优势的主要来源。人工智能不只是另一种产品或服务。这是一项基本的使能技术,可以添加到现有的流程和服务中,使其更加智能、更高效、更准确、更实用。AI并不是一个庞然大物。最佳解释为四种不同的应用程序:互联网AI、企业AI、感知AI以及自主AI。评估一个国家或公司在AI的现有能力和未来前景需要对这些不同的AI领域以及其他变量(如数据量、人才质量以及顶尖硬件的可用性)有细致的了解。
    通过以上分类,我们可以对中国人工智能的发展做出如下预测:新一代科技人才将加速中国人工智能的发展.目前中国出现了顶尖AI人才赤字,但是一支庞大的年轻科学家队伍正在积聚。我们预计这种人才短缺将随着时间的推移而演变成一个优势。
    ·AI就绪数据将成为一个关键优势来源庞大的数据集,以及在AI应用中的更大灵活性,将成为中国的核心AI优势。这个单一的优势是其他国家无法逾越的。
    ·中国将在四个核心AI应用中的三个应用中处于领先地位:中国在互联网人工智能、感知人工智能以及自主人工智能方面的能力不仅将非常强大,而且将处于世界领先地位。
    ·企业AI在中国将会滞后:由于缺乏企业软件和数据仓库,中国在商业智能方面的实力将发展得更慢。
    ·中国人工智能将继续受益于非常有利的监管环境:政府的大力支持将极大加快中国人工智能的发展。
    ·中国将成为一个全球人工智能大国:北京将成为一个硅谷级别的人工智能创新中心,超越多伦多、蒙特利尔和伦敦。
    AI方程中的关键因素
    AI是大量流程、数据分析、支持技术、应用程序和软件的总称,它使现有流程“更智能化”,并获得高度优化的结果。人工智能可以实现智能游戏(如AlphaGo),有效的金融应用(如贷款担保),超级人类感知(如语音或人脸识别),甚至是高级决策(如自主车辆)等。为了使AI发挥作用,需要四个重要的先决条件。
    ·海量数据:到目前为止,最重要的因素是大量标注数据集的可用性(例如,包括申请贷款的人以及他们是否偿还或拖欠贷款的信息;抑或是提交了客户投诉的人,他们是否满意或不满意等)。AI使用这些大数据集作为示例来引导算法进行优化。
    ·计算能力:庞大的数据集需要大量的计算能力。随着训练样本数量从数百万增加到数十亿,以及每个样本数量的不断增长(视频数据大于静止图像,静止图像大于语音,语音大于搜索或电子商务数据),训练样本的数量也随之增加。非常大的数据集通常需要并行处理,以及专门的硬件,如图形处理单元(GPUs)。 聚焦特定领域:当前的人工智能只应用于明确定义的单个领域。它不具备广义智力或常识(AI在经过训练确定贷款担保的任务中可以胜过人类,但是却不能进行任何其他任务)。
    ·所需的特殊(人类)专业知识:AI算法还不能算作是“平台”或“框架”,不能被普通工程师使用。尽管具备公开发表的学术论文甚至开源软件,但是专家还需要对AI进行“调整”,以便在特定的领域和数据集展开工作。这种状况可能会持续几年,直到像Google的第二代深度学习系统TensorFlow这样的工作变得像手机操作系统广泛使用的编程包一样容易使用。
    
    
    1  2  下一页>