如何应对AI时代大国竞争?深度学习平台这个“源动力”应由国人掌握

深几度

    
    文|吴俊宇
    1946年,英国首相丘吉尔在美国密苏里州富尔敦城的威斯敏斯特学院所发表的题为《和平砥柱》的演讲提到:
    从波罗的海边的什切青到亚得里亚海边的的里雅斯特,一副横贯欧洲大陆的铁幕已经升起。
    这场名为“铁幕演说”也标志着冷战的开始。
    自去年以来,中国顶尖科技企业正在遭遇一场“技术冷战”。
    而深度学习框架,可能成为下一个钳制中国产业智能化进程的武器。
    2018年8月,曾有人在天涯论坛提出这样一个问题:
    如果谷歌的人工智能学习系统TensorFlow不再开源,对中国人工智能有何影响?
    当时那个评论下面还一片乐观,大多数人认为不可能出现这种极端情况。但在今天,情况可能就不一样了。
    在国际知名第三方数据分析公司IDC发布的《中国深度学习平台市场份额调研》中,多达86.2%的受访者和企业都在使用开源的深度学习框架,而且对外国的深度学习框架依赖度很高。
    
    由此可见,AI时代,深度学习框架是最有可能的冷战战场,中国科技企业可能要做好各种极端情况的思想准备,尤其是及时寻找适合的国产代替品。
    一、互联网公司会被断供?
    自去年以来,“断供”“自主”突破科技领域,成为大众层面的热词。国人都意识到,对外国技术的高依赖度存在巨大风险,比如深度学习框架领域的TensorFlow。
    TensorFlow是是谷歌研发的第二代人工智能学习系统。被用于语音识别或图像识别等多项机器学习和深度学习领域。
    
    用谷歌研发人员的话来说:
    我们不希望开发者像盖房子那样,一块一块砖头地来,而是可以将几个已经弄好的模块组合起来。它可在小到一部智能手机、大到数千台数据中心服务器的各种设备上运行。
    目前,TensorFlow完全开源,任何人都可以用。正是如此,谷歌正在悄然成为将成为世界数据、硬件、编译器的标准制定者。
    IDC《中国深度学习平台市场份额调研》显示,Google深度学习平台在国内市场份额第一。中国企业对TensorFlow依赖度过高。
    我在TensorFlow找到了正在使用它的公司地图,其中有中国移动、联想、京东、美团、网易、小米、360、搜狗等一批中国企业。
    以京东为例,就在TensorFlow的框架上搭建了图像审核、文字识别硬件和广告等业务的AI技术;TensorFlow通过为京东云、京东商城、京东金融搭建了房子。
    但如果突然之间模块被撤掉的话会出现何种局面?
    京东过去几年搭建的模型恐怕要全部重写。互联网公司们的各种服务可能都会受到影响。
    打一个不恰当的比方,这无异相当于是一次地震。地震之后,你还得重新买房、重新装修,这个过程不是一两个月可以解决的。
    二、别怕,我们有飞桨
    好在,中国企业还是能有办法避免“地震”,这就不得不说到百度的深度学习平台飞桨(PaddlePaddle)。
    我们可以看一看飞桨的全景图。
    飞桨集核心框架、工具组件和服务平台为一体的端到端开源深度学习平台,囊括支持面向真实场景应用、达到工业级应用效果的模型,针对大规模数据场景的分布式训练能力、支持多种异构硬件的高速推理引擎等。
    
    它具备五大核心优势。
    在核心框架层面,同时支持动态图与静态图,兼顾了灵活性与效率;提供了70多个官方的、达到工业级应用效果的模型;支持大规模的分布式训练以及端到端的部署;为中国开发者提供系统的深度学习技术服务,有非常全面的中文支持。
    我们甚至可以打这样一个比方:
    飞桨早已成为AI时代的“全尺寸轮胎”。
    早在2012年前后,百度就开始研发深度学习技术。2013年,百度成立全球首个深度学习研究院。2016年,百度正式开源飞桨,这是中国首个也是目前国内唯一开源开放、功能完备的端到端深度学习平台。2017年,由国家发改委批复,百度牵头筹建了国内唯一的深度学习技术及应用国家工程实验室。
    这些年来,百度的飞桨正在悄然成为市场中的重要力量。
    IDC《中国深度学习平台市场份额调研》显示,百度深度学习平台被越来越多的企业与开发者所熟知,在中国深度学习平台领域的综合市场份额排名前三,也是唯一进入市场前三的中国平台。
    
    同时,百度飞桨正在迅速获得国内企业开发者认可,百度曾公布过一个数据,飞桨一周下周量增长12%,增速明显。
    三、为何飞桨获得如此拥趸?
    在今年4月份举办的国内首场深度学习开发者峰会上,百度一口气发布了11项针对飞桨的全新升级,升级内容涵盖了从开发、训练到部署、预测的每一个环节。
    百度在飞桨核心框架基础上,先后发布了VisualDL、PARL、EasyDL、AutoDL、AI Studio等一系列的研发工具组件和服务平台,可以满足不同层次的深度学习研发者的研发和创新需求。
    我简单翻译一下这些话,其中大概的意思是这样的。
    1、各个垂直领域的企业在希望使用人工智能技术时,百度都提供了一套房,可以拎包入住;
    2、深度学习开发者可以基于百度这套房进行定制、装修,装修出符合自己需求的房子;
    可以说,飞桨具备了非常强大的支撑企业级应用的能力,已经在国内的众多企业中广泛应用。而且由于是国产框架,飞桨的相关能力已经在百度自己的应用场景中得到验证,相比于TensorFlow,它更能满足中国企业的需求。
    飞桨对中国科技领域的重要意义,在于提供了一个国产的选择,不必受制于人。在人工智能正在支撑经济实现产业智能化转型的今天,飞桨对于国家产业安全更有着重要的价值。
    四、中国公司或该协同作战
    百度CTO王海峰一直是深度学习框架建设的倡导者,近年来不断呼吁应该重视深度学习框架。
    
    在去年4月,王海峰就在首届数字中国建设峰会上提到深度学习框架的重要性:
    上一代芯片我们有所缺失,所以现在遇到了一些困难。而芯片领域的下一步发展,会越来越多和AI技术结合,基于AI技术转化应用,这就要用到深度学习框架。因此,飞桨等深度学习框架一定意义上相当于AI芯片的指令集。
    今年,王海峰也在很多个场合强调:深度学习正在推动人工智能进入工业大生产阶段,深度学习框架是智能时代的操作系统。
    国产深度学习框架在目前的格局下,的确应该被重视起来。
    互联网公司可以更多转向飞桨而不是TensorFlow,避免未来出现极端情况。因为是长远来看,深度学习框架在本国公司手中掌握,才可以避免整个产业都受制于人。
    飞桨可以与国产芯片形成合力。
    最近百度和华为达成深度合作,飞桨和麒麟芯片将强强联合,这开了一个好头。深度学习框架和芯片联合的价值,已经在飞桨和Intel的合作中得到验证。
    此前有数据称,在百度和英特尔定制的CPU上,飞桨用ImageNet全量验证数据集在Resnet-50和Mobilenet-v1两个模型上,对比了INT8和FP32两者的性能,精度差距控制在1%以内,在性能上INT8相较于FP32有2-3倍的提升,效果非常显著。
    AI时代,我们和国际竞争对手站在同一起跑线,谁能获胜尚未定局。百度已经用飞桨为中国搭好了“地基”。
    在此之上,也希望中国的顶尖科技公司能够抱团形成合力,共同应对挑战。