让每个企业都能拥有自己的AI“大脑”,这样做对么?
当下科技文/当下君
图片/来源网络
让每个企业都能拥有自己的AI“大脑”,这样做对么?
AI的赋能方式正在急速的变化。
最早期,为了降低使用难度,企业往往通过提供API接口的方式帮助合作伙伴获得AI能力,但应用场景、灵活性比较受限;进而,深度学习框架的推广,低代码、零门槛平台的方式,接过了接力棒,继续降低AI的应用门槛,使得成百万开发者转型成为AI生态的驱动者。
一直以来都有人设想,是否可以把近年来流行的“中台”概念和AI结合起来。但也有人存有疑问——数据中台和业务中台都好理解,也都是从传统能力中解耦而来,而AI到底如何才能中台化?
现在,有一部分企业尝试在给出自己的答案,而我们也在思索,让每个企业都能拥有自己的AI“大脑”,对么?贵么?可实现么?
1
中台不完全史
2015年12月,一则消息传出,阿里巴巴集团宣布组织结构全面升级,建设整合阿里产品技术和数据能力的强大中台,进而形成“大中台,小前台”的组织和业务体制,使前线业务更加灵动、敏捷,迎接未来新商业环境带来的机遇和挑战。
在这次升级里,中台业务不是作为一个概念,而是作为一级组织架构而提出来的,而具体承担中台职能的,是阿里2015年12月成立的事业群,当时其组织架构级别,甚至和由阿里CEO张勇直接负责的阿里巴巴集团零售电商事业群并列。
此后,2018年阿里升级数据、业务双中台战略并积极对外输出,再到2019年数据中台全面爆发。
在中台这个风口中,原阿里中台事业群副总裁墙辉离职,创办来未来科技公司,定位是构建企业智能中台;原中间件首席架构师现为中台公司“比升技术”CEO;原业务中台首席架构师虞振昕以联合创始人兼CTO的身份加入深圳坤湛科技……可以说,阿里对中台概念的开枝散叶,起到了很大作用。
然而,这不能阻止到了2020年,行业内兴起了关于中台是否是一个伪命题的大讨论,阿里在某种程度上成为了声讨对象。这也说明,中台,一直都是争议和热度并存的创业风口。
其实,企业的中台和行业的中台,并不是一个中台,我们简单可以分为四类。
第一类中台,是经过企业自身长期实践发展出来的中台。
比如,阿里的中台实操,远远早于2015年,一直操盘阿里数据业务的朋新宇的说法是:“在2015年阿里公开提出‘大中台,小前台’中台战略之前,我们已经干了三四年了”。
这个意义上的阿里的中台,是在实践中成长出来的,是从双十一等业务挑战,过渡到技术、组织架构的实践,进而归纳总结而成的概念,所以中台战略最先的实践者和受益者都是阿里电商。
同理,像以AI能力为核心的百度,从2010年开始使用AI为各个业务赋能后,逐渐沉淀了一套以AI能力为核心的“AI中台”,同样可以称为真·百度中台。
第二个中台,是各大巨头”外销版”的中台。
比如阿里,“形成中台核心产品+专家咨询服务+生态交付合作”的体系后,通过与阿里云的结合向外销售。
同样,百度在2020年推出的AI中台、知识中台,也是和百度智能云结合,也是这种“外销版”的代表。
巨头加持的“外销版”中台,是在原有深厚产业基础上经过能力泛化的产物,也是技术底蕴最深厚的一类,是我们能够在是市场上买到的最好的中台产品。
而第三类中台,是有BAT背景的、在以上规模的企业里进行过中台实操的高级技术人员,在日后走上创业道路后,沿袭了多年中台经验而创立出的一些主打中台业务的企业,这类企业的开发者多多少少都有实操大企业中台的局部经验。
第四类中台,则是我们说的“伪中台”,因为中台并不是一个严格意义上的科学概念,所以市面上有各种各样的中台概念产品及公司,本质上都是各种技术或业务平台,在中台热后就甚至直接改名某某中台、某某中台企业等,这些“伪中台”大多没有经过实践的检验和积淀,或者并非真正意义上的中台。
因此我们可以得出一个结论,“最好的”中台是企业历经十年以上的业务沉淀打造出的“自用版中台”,但你买不到,买到也未必切合你的业务实际;所以“最合适的”中台,就是这些有深厚中台基因,同样具有提供体系化中台能力的企业推出的“外销版”中台。
而相对而言,由中台从业者创业的中台企业,可能也有很好的技术基因,但略不足的是没有前两种那么扎实的产业化实践,所以需要有针对性的加以甄别和探讨需求后才可以去试水,而最后一类“伪中台”则是这个行业要迅速挤掉的“水分”。
2
百度AI中台的前世今生
如果仅仅从定义的角度来看,中台的定义是相当宽泛的,百度百科的解释是:中台,互联网术语,一般应用于大型企业。一般是指搭建一个灵活快速应对变化的架构,快速实现前端提的需求,避免重复建设,达到提高工作效率目的。
在“中台”概念诞生前,一般只有“前台”和“后台”的区别。
前台是系统的前端平台,是直接与终端用户进行交互的应用层,比如我们在阿里的电商平台上购物,或者在百度搜索,或者用微信聊天,我们使用的就是“前台”的功能。
而后台是指系统的后端平台,终端用户是感知不到它的存在的(除非出了故障),所以,后台的一般是用来存储和使用企业的核心能力与数据的。
而中台,更多是因为公司业务在发展到某一阶段时,遇到瓶颈与障碍后,为解决实际问题而提出的解决方案。
所以我们不必拘泥于“中台”这个词前面加的是什么前缀,因为中台严格意义上只是一种思想,一种在前台和后台之间更灵活的交互能力的思想。
对技术人员来说,中台就是一个把后台的技术能力解耦后,放在中台的“武器库”式平台,像微服务开发框架、Devops平台、PaaS平台,容器云之类的,人们都叫它“技术中台”;而对业务人员来说,中台就是微服务业务平台,像用户中心、订单中心、各种微服务等,都可以叫“业务中台”;而类似的还有组织中台、知识中台、数据中台等等。
像百度的AI中台的诞生,就是一个这样典型的诞生故事。
大家可能知道,2009年,百度首次提出“框计算”,背后就是NLP和知识图谱等AI技术,这是百度第一次大胆的用AI技术改进搜索。
而到了2010年,百度开始发展NLP、语音、图像、知识图谱等AI技术方向,这是最早“百度大脑”的雏形;业务层面,也在图像、语音搜索等方面,加大了使用AI技术的比例,结果发现“一年的提升比以前好几年加起来都要多”,于是AI开始在百度庞大的技术体系内生根发芽。
2013年百度成立深度学习研究院,深度学习技术的突破被认为是人工智能技术爆发的原因。百度对深度学习技术的率先布局,奠定了中国有机会在AI时代领先全球的技术基础。
一个非常关键的年份是2015年。
这一年,李彦宏作为全国政协委员,在“两会”期间,首次提出“建议设立‘中国大脑’计划,此后,从这年到2020年,他提出“关于构建人工智能新型基础设施,勾画智能经济发展蓝图”的计划,此间先后写了13份有关人工智能的提案,8次出入人民大会堂参加政协会议,在最高平台上为AI呼吁,年复一年,日复一日。
2016年,百度正式发布“百度大脑”(当时,人脸识别准确率已高达99.7%、语音识别准确率97%;会27种语言,直接翻译毫无压力;描绘61.5万个标签制定个性化画像);正式开源中国第一个深度学习框架PaddlePaddle(飞桨)。
再到2017年DuerOS、Apollo正式对外开放,百度AI战略级业务布局完成,对内对外都开始正式明确百度在AI时代的“平台”定位,坚定AI战略为开放赋能。
那时百度内部已经有一个明确的想法——需要把百度体系内如星星之火一般的AI研发、应用、产品加以整合,集中力量办大事。
而当时百度内部的AI研发,的确比较分散,比如飞桨深度学习平台(当时还叫框架)已经诞生了,但内部还有别的学习框架也在尝试开发;而语音、图像处理、自然语言理解、大数据用户画像这些业务、技术,也分散在不同的部门里。
这个整合的过程,说来也很有意思。简单说,百度就成立了一个小团队,然后把这个小组作为业务BP(Business Partner),进驻到各个业务线里面去,开始整合百度的AI能力。具体说来,这支整合团队是先到各个业务团队,组织沟通会,然后就去站在业务的角度,了解他们对AI有什么需求,然后把这些需求集中起来。
比如,到了大搜索部门,收集的需求就包括“能够支持识别更多的方言”、“能够识别出老人和儿童的声音”;到了外卖业务团队,搜集的需求就是“如何根据用户的需求智能化的推荐”等。
参与了这个过程的一位百度工程师回忆说:“严格意义上讲,当时做这些搜集工作的百度人,脑子里可能还没有完整的中台概念,他们就是把派到各个团队收集回来的需求,列成一个大的需求列表,然后再去跟踪这些需求怎么用AI技术方案去满足,有了方案后,然后再去协调后端的相关能力。”
可以说,这个“协调组”已经有了中台的雏形,但他们同样也意识到两个问题:
第一:靠人力的搜集需求、沟通需求、满足需求的效率是很低的;
第二:技术部门和业务部门的人在需求上有错位,技术部门的人觉得自己开发的技术很强,业务部门的人觉得技术不够好用,这种矛盾当时比比皆是;
到了这个时候,读者可能已经明白了,百度的AI中台,就是百度在应用AI技术的过程中,不断把各个业务部门的AI成果、AI需求归拢、梳理、泛化、对齐后,开始尝试用“一套能够灵活的让业务部门用起来AI能力,也让后台的研发、运营、数据等团队更好的赋能前端”的体系,来把百度AI能力的“交换中心”具体化,而这个具体化的结果,就是百度的AI中台,以及此后派生出的知识中台等等。
而我们今天知道,这一切已经整合成了百度的AI中台,这也是为什么我们说,百度的AI中台是在技术实践中自然产生的,而不是先有“中台”这个概念,后有“整合中台”这个行为的缘故。
那么,百度的AI中台,是只有整合,没有创新么?恰恰相反,百度的AI中台形成,伴随着大量的创新。例如,以深度学习为特征的这一波AI浪潮起来后,很多技术要求都发生了变化,比如对于非结构性数据(如语音、图片)的汇聚,就是一个很突出的需求,而这在传统的数据中心里是一个弱项,所以百度的AI中台就要解决这个问题;又比如,AI爆发的算力需求,对AI加速提出了前所未有的需求,这就导致中台必须和大量的硬件适配,甚至最后还产生了专门用于深度学习的一体机(AI加速服务器);再比如,API是一个调用AI能力很好的方式,但如何能够建立强大的API库,就需要对后台进行各种改造。
换句话说,AI的高速演进、用户需求急剧的变化,决定了前台系统需要快速迭代响应用户需求,而前端的变化需要后端的变化来支撑,因此这就对后台的快速应变产生了要求。而后台设立之初核心目的并不是服务于前台,而是提升后端数据的安全及系统的管理效率,所以,这时候中台的地位就加以凸显。
从外部我们也可以看到,百度的AI体系一直在整合。2018年底,王海峰开始统领TG和AIG,总体负责百度人工智能、大数据、云计算、安全等技术和生态;2020年伊始,原AIG(AI技术平台体系)、TG(基础技术体系)和ACG(百度智能云事业群组)被整体整合为人工智能体系(AI Group,AIG),新AIG包含技术中台群组(TPG)和智能云事业群组(ACG)两大群组,继续由王海峰整体负责。
可以说,百度AI中台的形成,既是组织架构整合的一个投射,也是百度内部AI能力从散发到聚合,从使能到赋能的进化,最终,中台也正式以一个事业群组的方式,走上了百度的技术舞台。
那么,接下来自然而然的,就是百度开始面向行业输出基于中台的AI运营方法论,并深度参与到企业机制建设和运营推进中,最终帮助企业基于智能化中台实现业务的全面升级和持续创新,而这一切又带动了更多智能云业务的进展,百度实现了在toB业务层面的AI中台闭环。
3
移植智能化的大脑
在谈及百度AI中台的推广时,很多人都会问一个问题,既然百度飞桨深度学习平台已经使我们可以便捷的使用百度的AI能力,那么,引入百度的智能中台体系的价值何在?
笔者可以打这样一个比方,百度的飞桨好比一个公众图书馆,你在任何时候都可以去借书、研究、学习,也可以使用书里的知识;而引入百度的中台,则好比是为企业移植了一个AI的大脑,让AI能力成为企业自身技术能力的一部分。
前者,是外脑,随时可以用,在企业开始尝试引入AI来改进业务的“先行者阶段”、“工作坊阶段”,或者本身企业的规模还比较小的时候,使用外脑的成本是最低的;但如果你已经是一个规模企业,你需要形成自己的AI业务体系,那“外脑”就不如移植一个“器官”,让它长在企业的数字化系统里,随时随地为企业赋能。
引入中台的另一层面的价值是,并不是每个企业都像百度这样有AI原生的研发能力,在引入AI能力时,往往会出现各业务线自建AI系统、重复建设的问题,还进而会使企业的数据资产形成孤岛,分散在各个系统中,无法有效使用。而由于AI能力未能统一部署,不仅费用激增,还有统一升级困难,复用率低、应用分散等问题,难以形成全面及集中的管控,导致可能的风险无法妥善管理。
这些问题不是百度一家企业可以回答的,但他们在试图回答——百度集团副总裁吴甜在解读百度智能云的《AI中台白皮书》时,就分析了目前企业在智能化升级中面临的多个挑战。
例如,由于很多企业的AI技术底座薄弱,使得面向行业业务场景的模型研发与生产级应用难度很大,也就是我们常说的“碎片化”问题严重。
一般来说,中国的规模以上企业,大部分已经有多年的信息化投资,形成了事实上的“信息化中台”,但这些中台普遍缺乏AI应用研发与部署的支撑能力,这就使得企业开发新的AI算法模型的研发门槛高、AI技术与行业的融合应用仍有巨大的鸿沟。
一个令人触目惊心的数据是,在这些企业里,目前AI技术的工程转化率仅为 53%,也就是只有一半的AI需求能够最终落地。在这种情况下,一种低成本、易用、泛化能力较强的技术底座,也就是AI中台,成为企业智能化升级的关键。
又例如,我们反复谈过的AI人才奇缺的问题,在这些传统行业的一线,非常缺乏既了解行业情况又掌握人工智能关键技术,同时能进行应用开发的复合型人才,较大程度上迟滞了人工智能工程化应用步伐,这就需要AI中台上强大的开发能力给予支持。
《白皮书》还指出——目前,多数企业推动智能化升级的意愿强烈,但普遍缺乏清晰的战略目标与实践路径……核心在于缺乏体系化的智能化升级方法论支撑。
作为AI的“头雁”企业,百度把AI中台视为实现智能化能力普惠的必备基础设施,用来帮助企业构建AI生产力,一般包括AI技术服务平台、AI研发平台、AI管理运行三大核心。而更具体的说,百度的智能化中台包括AI中台和知识中台,后者是一个百度独有的概念。
所以,要理解百度的AI中台,要从4个层面加以观照:
第一个层面,是人工智能日趋成熟,开始呈现出某种通用性,而通用性才是百度向社会开放中台的前提,如果AI的通用性很差,只能在专用场景、专用人才的加持下使用,那就不具备大规模推广的前提。
百度CTO王海峰的看法是:“我们正处在第四次工业革命的阶段,每一次产业变革的核心驱动力都是科技创新。当下,人工智能技术日趋成熟,像以往每一次工业革命的核心驱动技术一样,呈现出很强的通用性,并且已经具备了标准化、自动化和模块化的工业大生产特征,成为第四次工业革命的核心驱动力量。”
第二个层面,是百度智能云AI中台解决方案构建了全栈式的AI能力生产、服务、管理解决方案,可以帮助企业建设AI能力的生产和集中化管理平台,使之成为企业的智能中枢。
所谓的“全栈”(full stack),也被人戏称为“全干”,可以简单理解为全局性、无所不能、无所不至的能力。在笔者看来,百度和其他AI企业的一个很大不同就在于,始终把自己放在全栈解决能力提供者的角色上。
例如,在过去的一段时间里,百度发布了知识增强大模型文心ERNIE文心3.0、规模隐变量端到端对话模型PLATO、跨模态多技术融合创新产品“数字人”。同时,在技术与场景融合创新方面,持续在翻译、搜索、推荐引擎、办公会议、以及工业、金融、智慧城市、医疗、媒体、农业等行业场景中进行深耕;而在软硬一体融合创新层面,自主研制了AI芯片百度昆仑,以及针对远场语音交互的百度鸿鹄芯片等,继续落实AI产业链上下游的重要技术布局。
百度拥有的全栈能力是能够向社会开放AI中台的一个很重要的技术底座。
第三个层面,是百度的AI中台具有自己鲜明的特色,例如百度智能化中台的一个重要组成,知识中台就是这样的典型例子。
知识是所有产业智能化升级的核心基础,而知识中台是基于人工智能的、对知识进行采集、精炼、组织和应用的能力平台,能够以服务的方式接入企业核心业务场景。
举个例子,我们的每一次搜索,都可以看做是一次获取知识的服务。最早,我们只能检索文本信息,此后,我们可以搜索图片、音视频,而现在还可以反过来用图片来搜索,用自然语言而不是关键词来提问,得到精准而不是模糊的推荐信息,这都是知识化服务的C端体现,而作为一个有强大搜索基因、体系化知识赋能底座的企业,百度的知识中台,可以支持搜索、问答、推荐,升级至辅助决策、预测、推理等各类业务场景的知识深度应用。
而AI中台与知识中台的协同,能够提升知识的智能生产、组织、应用等能力,实现企业中台的智能化发展。比如,某大型银行以百度智能云AI中台方案为主体建设人工智能平台,实现了通过知识中台,实现合同信息识别、关键信息自动提取审核、合同的自动化录入归档等知识服务的能力,大幅提升企业内部运行效率,就是一个鲜明的案例。
第四个层面,是百度提供中台这种“AI大脑植入”已经得到了产业界的积极回应,目前已经有近百个企业开始采用百度的中台服务,分布在金融、能源、制造、医疗、政务等领域,并且AI中台已经有独立的500多个场景模型,在深度上客户基于中台部署使用后,也在思考如何让中台发挥更大的作用,比如提出了运营创新等建设的需求。
当前,AI的应用、创新、落地仍需要漫长的路径。但有一点值得肯定的是,随着国家号召和顶层设计,企业数字化转型的力度不断加深,企业客户对技术驱动业务创新的投资有着越来越强的动力,而百度通过把“大脑”中台广泛植入各行各业企业的做法,无疑是站稳先手,通过在交通、金融、能源、医疗等行业的逐步渗透,并离客户需求越来越近。百度将会在一个很难度量的等待后,迎来自己的爆发期。
在关于百度AI的系列报道中,我们特别关注几个关键词,那就是“反碎片能力”、“通用化”、“人才”、“赋能”和“落地”。
这是因为,我们认为百度的“决胜AI时代”的目标,要比拼的是比竞争对手更快、更好的让AI产生正向的社会效益,和建立积极的社会效应和示范典范。
为此,我们看到百度干的很苦,因为它在任何领域,都既是领先者,也是启蒙者。在社会AI大生态没有建设完全的情况下,百度既要夯实基础,保证在AI前沿性技术上处于绝对领先地位,又要通过飞桨、中台、EasyDL、BML等方方面面的推进,提升反碎片能力,加速AI的落地和应用的便捷性提升;还要操心人才培养、产业教育、硬件研发等全产业链的问题。
我们只希望,付出者得到真正的回报,百度能够在数字化时代的创新中引领行业,为国为民,也为自己找到星辰大海。