科技自立自强,深度学习需要百度这道“飞桨”

邻章

    文|邻章
    现在起,科技自立自强、自主可控,不再停留在企业或行业的层面。
    在刚刚结束的五中全会上,“十四五”规划(2021-2025年)和2035年远景目标出炉,很多人都注意到,五中全会公报首次提出“把科技自立自强作为国家发展的战略支撑”,突出了创新在现代化建设全局中的核心地位,更进一步强调了科技的自立自强,并明确提出到2035年关键核心技术要实现重大突破。
    
    这表明了“十四五”期间,科技创新会被提升到一个更高的战略位置,以改变当前对美国技术依赖性强的被动局面,并成为拉动未来经济发展的重要力量。
    核心技术的范围还是比较宽泛的,但作为互联网、计算机相关的从业者,没人会否认,人工智能时代的狂风已经吹起,AI给社会、给经济、给生活带来的影响力将是前所未有。五中全会公报配合当下“新基建”上马的大潮,人工智能将迎来新一轮的发展契机,与此同时,能否将人工智能底层核心掌握在自己手中,某种程度上决定着中国科技竞争力的“天花板”。
    一、中国发展人工智能为什么需要自主可控?
    众所周知,人类社会正处在第四次工业革命的开端,人工智能则正是其核心驱动力,引领社会进入智能经济时代。错失了前三次工业革命机遇,我们自然不能再错失第四次,大力发展人工智能已成共识。
    从现实来说,在国家政策指引、相关科技企业以及科研机构的共同努力下,我国已成为全球人工智能一极。
    但在看到成绩的同时,也需要认识到:当下,众多中国企业的人工智能技术应用依旧严重依赖TensorFlow、PyTorch等国外企业提供的深度学习框架。
    所谓深度学习框架,百度CTO王海峰的定位很精炼——“在智能时代,深度学习框架起到承上启下的作用,下接芯片,上承各种应用,具有重要价值,是‘智能时代的操作系统’。”
    用更为通俗的话来解释,深度学习平台(框架)就犹如一栋房子的地基。但现实情况却是,大部分的“房子”都建立在外国的地基上。
    这会带来很严重的问题:一是核心技术容易形成代差,因为外国不会开源最先进的技术;二是存在重要数据泄露风险;三是技术封锁带来安全风险。
    特别是近几年,复杂的国际形势,为国家间科研、商业等方面的交流带来很大的阻碍。而人工智能已经被各国视为国家战略,贸易保守主义的抬头、“实体清单”的存在,使得人工智能技术,尤其是深度学习框架,被蒙上一层随时可能断供的阴影。
    
    (开源及私有代码托管服务平台GitHub突然限制了克里米亚、古巴、朝鲜、伊朗和叙利亚等国家用户访问就是个很典型的例子)
    中国信息通信研究院政策与经济研究所副总工何霞表示,“我国高度重视信息安全,产业安全和国家安全。如何保障安全,需要有核心的技术,安全的平台和完善的管理。”中国科学技术发展战略研究院研究员、科技部新一代人工智能发展研究中心副主任徐峰也表示:“在开源创新平台方面,科技部有布局,国家政府持特别鼓励的态度;产业政策方面,科技部会再对接实验区建设和平台建设做工作,搭建交流平台,让AI和经济社会做深度融合;更重要的是教育方面,需要将AI课程普及进校园,包括教材编写等。”
    所以,从技术迭代、数据安全等角度而言,实现深度学习平台(框架)自主可控的必要性已毋庸置疑,毕竟只有在自家牢固的“地基”上搭起的AI万丈高楼才有安全感。
    二、中国人工智能发展能否自主可控?
    国内人工智能产业应用高度依赖国外深度学习平台的潜在风险,很早就引起了业内的警惕。近年来,一些企业也推出了国产深度学习框架。
    除了百度在2016年宣布飞桨深度学习平台开源,还有DI-X、旷视天元、MindSpore、计图等产品的推出,让国产深度学习平台呈现整体崛起的态势。
    特别是飞桨,在经历多年产业实践后,现已成长为开源开放、功能完备、生态繁荣的深度学习平台,可作为国内企业寻求安全可控、替代TensorFlow、PyTorch等美国产品的新选择。
    在此,我们可以从这样几个层面来一窥这道“飞桨”的实力。
    从基础能力层面来看:百度飞桨已经集深度学习核心框架、基础模型库、端到端开发套件、工具组件和服务平台于一体,包含完整的开发、训练、推理的端到端深度学习AI模型开发工具链。截止目前,飞桨官方模型库算法总数达到146个,预训练模型已达200多个。在深度学习模型开发、训练、预测和部署等方面,已可比肩TensorFlow、PyTorch等国际主流框架。
    同时,飞桨的能力迭代也非常快——去年11月全新发布和重要升级21个产品方向后,在今年5月召开的“WAVE SUMMIT202”深度学习开发者峰会上又带来了35项全新发布和重要升级,推出飞桨企业版,用以全面满足不同规模企业的业务开发需求。在这次百度世界2020大会上,飞桨又迎来“动静统一、软硬融合”的更新:硬件上适配22种芯片型号,覆盖15家硬件厂商,对国产硬件的支持超过TensorFlow和PyTorch;软件上,动态图功能升级实现了动静态的结合,让用户更容易开发模型,全面升级的API体系,则对于开发者更加友好。
    从生态层面来看:公开数据显示,飞桨已经凝聚了超过230万开发者,服务超9万家企业,基于飞桨平台创造了31万个模型,覆盖了通信、典礼、城市管理、民生、工业、农业、林业等众多关乎国计民生的行业和领域。更与英特尔、英伟达、arm中国、华为、MediaTek、寒武纪、浪潮、中科曙光等启动共建硬件生态合作圈。
    从具体产业实践来看: 百度飞桨的能力已经在大工业生产中得到验证。例如在消费类电子领域,OPPO在其多个业务线都上线了基于飞桨构建的大规模分布式推荐系统,覆盖全球3.5亿月活用户;工业安全领域,通过飞桨研发的输电线路通道隐患目标图像与视频智能检测系统,实现了输电线路通道隐患目标的自动化识别和预警;环境保护领域,飞桨支撑的无人机自主飞行+应用管理平台,可以对森林进行自主巡逻、火情监测、非法入侵、森林树木砍伐监测等功能……而这些只是百度飞桨深度学习平台产业实践的冰山一角。
    从市场地位来看:飞桨正日益展现出强大竞争力,成为中国人工智能抗衡国外TensorFlow、PyTorch等产品的绝对力量。据统计,飞桨在国内深度学习市场份额稳居第三,仅次于Google TensorFlow。在第六届世界互联网大会上,飞桨入选了世界互联网领先科技成果,可见其在行业和市场中的地位。
    综上:从技术实力、生态规模以及产业落地实践来看,百度飞桨深度学习平台已然具备承接大量中国企业由国外到国内平台转移的足够能力。
    三、产学研携手共建,筑牢人工智能地基
    虽然飞桨当下已成长为国内唯一开源开放、功能完备的深度学习平台,在市场份额发展上也展出了迅猛势态,但也需要客观承认的是,其在整体市场份额层面,距离TensorFlow、PyTorch等主流平台仍有差距。
    如何抹平中国与外国的差距?在我看来,需要从政策扶持、产学研三方共建入手,以共同实现发展繁荣,筑牢中国人工智能地基。
    特别是政府、产业、学术界需要更多地“打配合”,来集中力量办大事,促进百度飞桨、旷视天元、MindSpore等国产深度学习平台进一步成长,进而最大程度降低未来国际环境恶化带给国内人工智能产业的损失。
    
    (飞桨已经在产学研界有着大量合作共建)
    此外,国内大部分的深度学习平台在构建底层平台所需的技术门槛高、周期长、投入大的现实下,这些平台的基础功能完备性、产业具体实践以及生态构建等层面,都还处于非常稚嫩的状态,离飞桨尚有距离,更别说对标TensorFlow、PyTorch等成熟产品。
    因此,无差别“大水漫灌”可能不是一个好的选择,从投入产出比的角度来看,重点扶持百度飞桨等优势产品,做到“力出一孔”,可能是应对国际形势变化、把握超车时机的最好选择。
    写在最后:
    飞桨已经在技术上取得大量升级突破,并在工业大生产中得到充足验证,许多国产深度学习框架的出现,也证明了中国人工智能的整体实力 。中国拥有世界上最多的AI开发者,算法层与应用层也领先世界,只要合理进行政策扶持引导,加强产业横向与纵向的合作,打造良性的生态集合,必然能实现“国货自强、掌握核心科技、自主可控”的最终目标。
    作者:邻章系独立撰稿人,专注科技互联网评论,致力传递价值思考。