大环境:AI工业大生产还缺什么?
当下科技文/当下君
AI领域的发展,在2021年开启了“外卷模式”。
外卷,网络用语,指通过向外拓展新的资源的方式进行竞争,是“内卷”的反义词。
和部分领域因为缺乏技术创新而被迫开始内卷相对应,AI领域充沛的技术红利,使之不断外卷,积极向外拓展资源,集合社会力量而形成新的大生态。
过去,人们认为,只要把平台、产品和服务打磨好,做出成熟的通用性解决方案,并在各个细分领域推广落地,AI就可以水到渠成。
但事实上,AI领域的瓜熟蒂落,从不依赖某一个单点突破,它需要一个完整的生态,而且并不是围绕单一企业建设的狭义生态,而是真正意义上“产、学、研、用”结合的社会大生态。
只有真正完成整个AI大生态的拼图,AI才能整体的降临,而本文则记录了许许多多为这个目标努力的机构和个人。
1、大环境:AI工业大生产还缺什么?
公众对科技发展的节点的认知往往是非常感性的,比如对于普通人来说,iPhone的问世就说明移动互联网时代的开启,阿尔法狗战胜人类棋手则意味着AI时代的到来。
但在真实世界里,一种新的技术从理念突破、技术突破到工程突破,乃至于最后的商业化落地,过程漫长且艰难。
美国科学哲学家托马斯·塞缪尔·库恩的《科学革命的结构》是科学哲学的经典之作,他的研究表明——上世纪中叶以往的科学,更多地表现为个体劳动的特征(小科学);现代科学技术的发展,促使这种劳动方式发生改变,它使科学制度化、专业化和集约化的程度大大提高(大科学)。
但大科学的社会化落地,并不仅仅依赖一些代表性的科学成就的出现,它更多程度上,需要人类作为一个共同体,承认、参与和推广这些代表性成就,并形成共识、形成生态,成为社会发展的主范式。
我们期待的AI技术驱动的第四次工业革命,AI工业大生产时代,正在到来。
AI的工业大生产必须有两个标志,第一,AI是基础源动力;第二,围绕AI进行的能力输出,被体系化、生态化并形成新的商业闭环。
一些数字化原生企业,已经率先在内部形成了AI工业大生产,例如较有代表性的百度,企业内部已经形成AI底座,体系化的对各类型业务持续赋能,在百度内部形成了AI大生产的格局,简单说,就是AI成为主引擎,以AI驱动各种业务,以AI能力形成主要差异化竞争力。
某种意义上,百度正是把自己多年“踩坑”才探索出的AI大生产平台,通过“外化”的方式,试图发展成全社会的“AI大生产平台”,并在此之上联合社会各界,开始共创启动AI大生产所需要的“AI大生态”。
这个大生产平台就是飞桨。即使把对比的维度放到世界范围内,我们也可以基本笃定的说——百度的飞桨产业级深度学习开源开放平台,是典型的AI大生产平台,它赋能广大开发者,有力支撑AI工业大生产,促进技术创新和产业智能化升级。
飞桨为古老的东方国度在新世纪里具备世界竞争力在赋能。
飞桨的成绩,绝不仅仅是百度一家在努力的结果,一组数据很能说明问题——飞桨发布至今,已经凝聚了406万开发者,创建47.6万模型,服务15.7万个企事业单位,位居中国深度学习平台综合市场份额第一。
上面的三组关键数据,就是我们所说的,一个新的技术“主范式”所能凝聚的社会共识和产生的社会效应。它突出的表现在,这些开发者基本全部是百度之外的,他们所创建的模型、所服务的领域,也绝非仅仅在数字化程度较高的局部行业里,而是真正的千行百业。
有一个统计数据是中国有4200万工程师,如果从这个纬度来看,飞桨至少已经让中国10%的工程师成为了AI开发者,当然这个数字不一定精确,但至少从宏观规模上透视了一个现象——当一个技术体系能够让一个国家10%的工程技术人员去尝试、学习和探索,并且继续计划要培养500万AI人才的时候,那么,AI工业大生产的核心要素——人力资源,就可能具备了。
当然,如此多的人能够顺利的实现AI探索,而他们绝大多数并不曾接受体系化的AI教育,那么就必然得出一个结论——飞桨平台提供了强大的工具体系,极大的降低了AI学习、开发和使用的门槛。
2、工具,越来越好用的工具
人类是在学会使用工具后,才改变这个世界的,AI就是我们创造未来的工具体系。
12月12日,由深度学习技术及应用国家工程实验室主办的WAVE SUMMIT+2021深度学习开发者峰会在上海召开,飞桨在会上发布了十大最新技术和生态进展,其中,技术的进步诚然让我们震撼——比如飞桨新版全景图—产业级模型库新增文心大模型、飞桨开源框架v2.2 体系化新增科学计算API、端到端自适应大规模分布式训练技术等。
从笔者的观察视角,那些工具/平台的更新和利于生态发展的进展,更是本文重点考察的目标——即飞桨是如何通过有效的提供工具+完善生态,来帮助千行百业实现“产、学、研、用”正循环。
这方面的进展也非常多,如业界首个产业实践范例库、飞桨“大航海”2.0共创计划、多层次低成本的硬件适配方案、产业级开源模型库模型超过400个、企业版升级自动高效的模型部署功能,以及1分钟极速安装完成本地高效建模的飞桨EasyDL桌面版等。
工欲善其事,必先利其器,有了不断降低AI开发门槛的“武器”,才有AI工业大生产的早日到来。
百度CTO、深度学习技术及应用国家工程实验室主任王海峰在会上讲的一句话非常重要,他说:“当今,人工智能呈现出融合创新和降低门槛的特点:一方面,AI技术及产业的融合创新越来越多;另一方面,虽然AI技术越来越复杂,但AI开发与应用的门槛却越来越低”。
融合创新增加、技术的复杂性增加,但开发应用的门槛降低,才是AI大生态形成的基本条件,也是百度的核心能力的体现。
比如,大模型现在是很热的概念,公众的感知是“很先进,很前沿”,但百度从降低门槛的实际出发,并不一味追求规模大、参数多,而是通过飞桨平台,让基于大模型的开发,变得高效、灵活、易用,反而解决了大模型的算力需求过大,泛化能力欠佳,经常难以解决应用场景中复杂多变的实际问题的传统难题。
在许多场景化的应用方案中,文心大模型可以实现多尺寸的模型蒸馏,甚至以极小尺寸适配具体需求,降低了大模型使用门槛与成本——在60多项国际著名任务上,百度文心都取得了领先优势,其中有30多项是小样本、零样本学习的任务,表明其文心的泛化应用能力更强,可以低门槛适配行业需求与行业能力。
更重要的是,通过飞桨这个“操作系统”,普通的AI开发者也能使用大模型的泛化成果,例如,通过与知识的结合加上跨语言、跨模态能力的融入,开发者可以完成更加多样化、通用化的任务,在通信、金融、医疗等领域具备广泛的落地可能性。
飞桨全新发布了开源框架2.2版本后,在工具与平台方面,也“下放”了更多的能力和“利器”。
EasyDL和BML双平台,是飞桨企业版最亮眼的“双子星”,因为它们距离开发者最近、距离需求最近,此次基于飞桨推理部署工具链,与平台深度融合,升级打造自动高效的企业级部署等功能。
略说一二。
比如,一个平台是否受欢迎,很大程度上看硬件的支持力度。飞桨企业版目前已完成9345种模型芯片组合的真实测试和调优,可以覆盖95%的需求场景。
更重要的是,这相比开发者自行适配,要节省97%的开发时间。
当天的现场还有一个明星是一只机器狗,它的本质其实是一个具备边缘计算能力的硬件平台,以前,给这种平台部署一个新的模型,可能要花好几天;但在飞桨企业版最新的可视化智能边缘控制台的支持下,工程师现场演示了只用5分钟就部署一个新模型——机器狗快速掌握了识别手势的新技能,耗时仅仅相当于下载一个APP的时间。
而最新发布的飞桨EasyDL桌面版,不必繁琐的配置各种环境,在桌面一键极速安装即可实现本地高效建模,1分钟安装完成,15分钟就可完成模型开发。
这样的例子还有很多,飞桨就是通过这样一个个细节的打磨,帮助生态开发者节省一天、一个小时、一分钟,减少几千、几百、几十个步骤……笔者相信,这才是飞桨能吸引406万开发者的核心——谁不希望和一个每天都在成长、不断“外卷”的生态,一起共创和面向未来呢?
3、人,起决定因素的是人
在WAVE SUMMIT+2021上,令人最有感触的是人,普通人。
百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜在这天就花了挺长的时间介绍一个普通人。
他叫李桑郁,一位普通的铁路工人,听起来和AI似乎搭不上任何关系。
李桑郁的工作内容中,最繁琐的莫过于人工核对货运车号,为此,他每年要拍摄、审核20万张图片,而且错误难以避免。
然而,这个普通的铁路工人,通过在飞桨AI Studio上自学,最终使用飞桨的开发套件,在没有外力的帮助下,自己从头到尾实现了铁路货运车号的自动识别系统的开发。
使用了新系统之后,原来人工需要几个小时的工作量缩短成了三分钟,为他所在的襄阳铁路段节省了20余万元的成本。而为了表彰他的工作,襄阳铁路段为年仅25岁的李桑郁设立了AI创新工作室。
一个普通的、但热爱钻研的铁路工人,和易学易用的飞桨组合,就在百年工业——铁路系统,实现了一个环节的AI飞跃。
将来改变中国AI史的,可能是百度的高级科学家们,但更可能是通过几百万个李桑郁这样普通的、但有学习、攻关能力的一线业务人员,他们从AI先行者变成了AI工作坊的主持人,并必然进阶为AI工业大生产的“关键先生”。
另一个非常有魅力的是Wave Summit的开发者市集,这里展示的完全是一些以AI开发为爱好的普通人的作品。
外贸电商从业者刘心怡是个很清秀的女生,她带来的是名为“星星的孩子”的孤独症儿童互动游戏。
北邮的一批学子们,带来了“复活东坡”项目,画中的苏东坡动了起来,通过实时语音合成与唇形驱动,完美的实现了前贤与今人跨越千年的对话。
而令百度的专家们、开发经理们都大为叹服,而且推荐笔者“一定要去”参观的是一位名叫王京京的开发者的展位,他展示的是一套视觉驱动的“石头剪子布”机械手,但其实真正的奥秘是他开发的摄像头——通过和飞桨EasyDL的结合,这个摄像头可以像下载软件一样灵活的增加功能,适用从最专业的工业质检到最质朴的儿童游戏。
我们可以预想,随着AI原生时代的开启,一批生于AI时代、视AI为社交货币的年轻人被不断“外卷”成为生态的一份子后,将会形成这样一种发展范式——利用飞桨强大的能力,一批个人工作室、创业公司崛起,他们不贪大求全,在细分领域却钻的很深,他们人数众多,多到改变AI的人才结构。
其实,吴甜在会上也说了一句切中要害的话,她说:飞桨的建设,要持续地进行技术创新,要永远以开发者的需求为首位,要和整个生态一起共享和共创。
所以,我们也看到,吴甜带来的“大航海”计划2.0的发布,在“领航”、“启航”、“护航”的基础上增加了“共创”计划。共创计划包含三方面:第一,以飞桨平台为基座,社区开发者共创工具、模型、产业案例与实践经验;第二,形成产业创新需求对接平台,共创产学研用正循环;第三,与更多生态伙伴一起建设产业赋能中心,共创区域创新生态。
这个“共创”就可以理解为“外卷”,也就是不断向外部拓展资源,通过让更多开发者共创工具、模型,把更多的产业案例与实践经验,把更多的产业需求对接,更多的区域伙伴创新生态,都“卷”到AI大生态里面来。最终形成产学研用的正循环。
向外无限延伸,正是外卷的特征,也是一个生态正处于快速成长期的表征。
写到这里,如果略微梳理,我们不难发现,百度不仅有首席AI架构师培养计划(AICA)这样的高端项目,也有和教育部、科技部、各大高校的合作计划,有面对更普及层次的AI实用人才的百万级培训目标,更有把许许多多企业加入飞桨技术伙伴生态的大航海“护航”计划,所有的一切,都是为了让整个生态活起来,形成正循环。
如果我们乐观一点估计,在全国的工程技术人员中具有一定AI开发能力者,占比达到30%甚至50%的时候,我们期待的AI工业大生产,将无可阻挡的到来。
这一天,并不遥远。
转载请留言
并注明来自「当下Tech」