开源5年,百度飞桨如何做到越飞越高?
文|智能相对论
作者|佘凯文
“人工智能”作为第四次工业革命的代表性科技,在生活、生产及社会经济方面所取得的成绩已经相当显著,并且普遍认为人工智能带来的生产力提高将远高于前三次工业革命。
今年两会期间,推动人工智能产业发展也成为科技圈大佬们热衷的提案,更是涵盖交通、教育、养老、数据治理等众多领域。
然而时至今日,人工智能技术依旧还有不足,如何解决?在5月20日召开的“WAVE SUMMIT 2021”深度学习开发者峰会上,百度首席技术官王海峰就分享了关于人工智能技术和产业发展的两点思考:一是融合创新。多技术融合创新、深度学习平台与芯片软硬一体优化、人工智能技术与应用场景融合创新发展的趋势愈加明显;二是降低门槛。随着人工智能技术在各行业的渗透,面向不同应用场景,高效满足不同的开发者需求,持续降低门槛非常关键。门槛的大幅降低,加快了人工智能应用的多样化和规模化,加快了产业智能化进程。
开源5年,百度飞桨如何做到越飞越高?
从国家“十四五规划”起,将“人工智能”列为了需要重点突破的科技前沿技术之首,提出要继续加大培育并壮大人工智能产业。
如今随着人工智能技术的突飞猛进,已经陆续在不少简单或危险领域出现了全面人工智能替代,另一方面人工智能也在加速产业智能化热潮,整个产业正展现蓬勃之姿。
将目光移至几年前,可能很难相信如今国内人工智能产业的发展速度,特别是人工智能的一些核心领域,比如作为AI时代“操作系统”的深度学习框架,深度学习技术是AI面向深层次不断前进的基础,也是科技巨头转型角逐AI时代的核心内容。
其中百度飞桨深度学习开源开放平台,既成为这个时代人工智能飞速发展的见证者,也是推动者。因为就像在“WAVE SUMMIT 2021”峰会上百度集团副总裁、深度学习技术及国家工程实验室副主任吴甜所言,从企业中的少数人开始考虑“我们面对的问题能不能用AI来解决”,到真正的实现高效、高质量的大生产,把AI技术的价值带入到企业的生产活动当中,是否存在一条可以参考、可以实践的路径?而飞桨将这条路径打通了。
峰会上吴甜首次公开分享了飞桨通过与产业伙伴的广泛合作所观察到的AI工业大生产的实现路径。企业应用AI的过程分三个阶段,第一阶段是企业中有少数先行人员尝试引入AI进行原型验证,称之为AI先行者探路阶段;当进行了验证产生效益后,会从个人实践转变成建设团队来学习和应用AI,称之为AI工作坊应用阶段;当企业进行大量的AI应用,几百、几千人一起工作,多人多任务协同生产,就进入了AI工业大生产阶段,更长期看,还会实现社会化协同大生产。
而对应于不同阶段的企业,飞桨都能提供相应的解决方案,帮助企业实现快速且有效的场景落地,俨然飞桨已成为企业AI技术落地的“前哨站”。
自2016年飞桨正式开源,从此中国终于有了自主研发可控的深度学习平台,至今飞桨已经历经多次升级,今年在“WAVE SUMMIT 2021”峰会上带来九大最新发布。
产品技术层面发布了飞桨开源框架V2.1、大规模图检索引擎、文心ERNIE四大预训练模型、硬件生态进展、推理部署导航图、云原生机器学习核心PaddleFlow。这些技术层面的核心总结起来就是一点就是“让AI开发者具备更高的技术能力和更低的进入门槛”。
像开源框架V2.1的发布,实现了将自定义算子功能全面升级,进一步降低了开发者自定义算子的学习与开发成本,大幅提升开发灵活性。而开放云原生机器学习核心PaddleFlow,则是专为AI平台开发者提供核心能力并赋能更多细分场景和深度定制的AI平台。
生态层面宣布飞桨“大航海”启航计划取得阶段性进展,并正式发布《AI人才产教融合培养方案》、正式发布“大航海”护航计划及“大航海”领航计划。
随着这些计划的陆续落地实施,在助力广大开发者及企业实现AI工业大生产的同时,飞桨也必然成长为中国人工智能的核心基座。
无论时代的车轮前行得多快,飞桨硬是凭借过硬的“自身素质”领先于时代之前,其最终目的,就是让AI开发具有更高的技术能力和更低的进入门槛,以为产业做减法的形式,增加产业智能化升级的广度和深度提速,而这也是飞桨越飞越高的核心本质。
紧握产业智能化转型要素,飞桨软硬件两手抓
都说“光说不练假把式”,技术也一样,评价任何技术优劣都需以最终的落地实践为标准,人工智能技术当然也不例外,所以评判人工智能技术的最佳方式还是在于看看其在产业端的应用、融合究竟怎样。
首先,技术不能脱离生活,离生活太远再厉害的技术也将失去光泽。所以,透过飞桨的延伸视角,能看到正是哪里有需要,飞桨就去哪里。
比如,去年的疫情让我们对药物研发、疫苗设计等生物工程的效率有了更高的期待,于是飞桨发布了生物计算平台PaddleHelix螺旋桨进行跨界探索。具体到实际应用,抗疫期间飞桨与医疗机构共同开发了CT影像肺炎筛查与病情预估系统,可以快速检测识别肺炎病灶,为病情诊断提供病灶的数量、体积、肺部占比等定量评估信息。
又比如前不久飞桨与成都国铁电气设备有限公司合作解决轨道交通巡检难题,传统的高铁检修手段严重受限于人工,也让企业背负了高额的人力成本及低下的工作效率,飞桨的介入让轨道交通安全运维问题的解决有了新的可能。成都国铁借助飞桨的PaddleDetection等套件解决了AI算法难题,研发了一套“轨道在线智能巡检系统”。
类似的案例还有很多,产业智能化浪潮的推动造就了飞桨速度,同时飞桨也在不断夯实“十四五”规划中提出的“推进产业基础高级化、产业链现代化”,走向国家发展的战略支撑。
其次,技术还需广泛渗透进企业业务流程的主要环节之中,真正帮助企业实现智能化的转型升级,飞桨在这方面也取得了不俗的成绩。
比如在电力方面,与南方电网合作的巡检机器人,利用飞桨团队实现的高性能目标检测算法YOLOv3及语义分割算法U-Net,巡检机器人突破了干扰力巨大的环境因素障碍,使过去工作人员花费6个小时的现场巡视,现在只需要在远方的主控室一键下达巡检任务就轻松完成,大大节省了南方电网的审核工作量与成本。
又比如,目前全国大大小小的产业园都面临着同一个矛盾,即产业智能化转型需求旺盛,然而在AI技术落地过程中的痛点与技术难题频出,飞桨则成为解决这些矛盾的关键。
现阶段,飞桨已经覆盖到了工业、能源、金融、医疗、农业、城市管理、交通、信息技术等各种各样的行业和场景;并聚集了320万开发者,服务了12万企业,创建了36万模型,而且这组数据还在持续增长。飞桨深深扎根于产业智能化升级的事业之中,在为企业产业护航、聚力共振方面当仁不让。
聚力核心基座,共享智能化浪潮
如王海峰在峰会上所言,在人工智能领域“高效满足不同的开发者需求,持续降低门槛非常关键”。那么这“一高一低”两个核心,飞桨又是如何实现的?
在提升技术能力高效满足不同开发者需求方面,飞桨的应对措施是“升级”,前面也有提到今年飞桨的九大发布,其中像“大规模图检索引擎”支持万亿边的图存储和检索,大规模图模型训练架构支持网易云音乐等企业大规模应用落地、“文心ERNIE四大预训练模型”则是实现了统一的跨模态语义理解,目的都是为了强化飞桨的服务能力,使其更高效满足开发者需求。
而开源框架V2.1、推理部署导航图、开放云原生机器学习核心PaddleFlow,则都在降低AI开发应用的门槛,满足不同行业、不同阶段、不同层次开发者的需要。
同样也是基于“一高一低”两个核心,使飞桨在开发者、合作伙伴赋能及人才培养、产教融合方面都取得了卓越成绩。
在助力开发者方面,据最新数据,飞桨平台已经凝聚了320万开发者,相比一年前增幅70%,也是基于飞桨平台,使这320万开发者不再需要从头编写人工智能的算法代码,即可高效进行技术创新和业务拓展。门槛的大幅降低,加快了人工智能应用的多样化和规模化,加快了产业智能化进程。
在“WAVE SUMMIT 2021”峰会上飞桨与三大高校创新创业实验室现场签约,包括清华大学基础工业训练中心、吉林大学创新创业实验室、郑州大学人工智能工程应用实验室,宣布将共同推进产学研用一体化发展,打造产业智能化预备军。此外,过去三年百度与教育部新工科累计举办了14期师资培训,覆盖了所有985、211高校,共培训了2000+名老师,其中226所高校已基于飞桨开设了学分课。
人才培养方面,飞桨更是一马当先,目前已经建起涵盖“学习、实践、比赛、认证、就业”的开发者全周期服务体系。去年开始,飞桨针对业内开发者也设置了专门的课程和培训体系,包括面向一线工程师的AI快车道、企业闭门交流AI私享会以及AICA首席AI架构师培养计划,在边学习边实践的体系下,为广大开发学者提供了广阔的舞台。
另外,随着飞桨“大航海”计划的全面启动,15亿元资金和资源将不断落实到技术、人才、生态等各方各面,届时“大航海”护航计划将赋能全方位支持10万家企业智能化升级,培养百万AI人才;领航计划将以PPDE飞桨开发者技术专家、PPSIG特殊兴趣小组、飞桨领航团等为主要组织形式,与业界优秀的开源社区和开源项目合作,系统化的设立研究和研发方向,联合优秀的开发者、优秀的开源社区一起共建深度学习开源生态,携手探索AI前沿领域;启航计划将与全国500所高校深度合作,重点培训5000位高校AI师资,联合培养50万AI学子。
可以预见,随着百度飞桨的持续投入,一批具有中国产业特色的人工智能大军必将应运而生, 同时飞桨作为开源底座也将越发的繁荣与厚实,在不断推动产业智能化之时,属于飞桨的烙印也被深刻其中。
总结
总而言之,当下飞桨正以开发便捷的深度学习框架、超大规模深度学习模型训练技术、多端多平台部署的高性能推理引擎、产业级开源模型库四大领先优势,不断助力各领域产业智能化转型升级。而以飞桨为核心的智能化体系,也正不断激起时代的智能化浪潮。