成财报突出重点，百度文心一言有何底气？

2024.08.29 罗超频道

面对一个新技术时，人们总会高估其短期价值、低估其长期影响，正如日中天的ChatGPT面临同样的待遇。ChatGPT并不是一项新技术，而是OpenAI基于早在2020年就已发布的GPT－3．5大模型微调后开发出的对话机器人产品。ChatGPT是生成式AI的代表产品，这类产品的走红是预训练大模型技术爆发的结果。

当ChatGPT在国外探寻商业化的可能时，国内用户在可见的未来还无法使用它，但基于同一技术的产品却已呼之欲出。前段时间，百度已宣布3月将发布新一代大语言模型“文心一言”，而在2月22日发布2022年财报时，百度进一步表示正“全力冲刺研发大语言模型、生成式AI产品文心一言。”李彦宏同时发出一封全员信鼓舞冲刺者们的士气，他明确表示百度会将多项主流业务与文心一言（ERNIE Bot）整合，“中国AI市场即将迎来爆发性的需求增长，其商业价值的释放将是前所未有的、指数级的。而百度作为中国人工智能市场长期增长的最佳代表，正站在浪潮之巅。”

    对于百度的文心一言，我观察到科技圈存在着三种典型的疑问：
    1、“不知道百度之前做了多少工作，这么有把握在短期内弄出来。到时候不知道会不会翻车甚至跳票？”
    2、“如果说百度早具备做文心一言的底层AI技术，为什么没先做出来？”
    3、“为什么国外巨头扎堆做生成式AI产品，中国科技巨头中只有百度有实力做类似产品？”
    以上这些问题正是本文探讨的主题。
    文心一言，是百度让AI沸腾的“最后一度”
    ChatGPT底层技术并无颠覆性，预训练大模型在AI产业已出现四五年。预训练大模型技术本质是深度学习的“加强版”，通过给模型“填喂”大数据提高其自学习能力，进而具有更强的智能程度，比如在自然语言处理上表现更佳。
    2018年谷歌发布了拥有3亿参数的BERT预训练模型，它将自然语言处理能力推向了全新台阶，凭借出众的成绩屠榜各类AI榜单和测试数据集，BERT开启了AI的大模型时代，接下来几年，大模型的“擂台”各路挑战者接踵而至，除了OpenAI，还有英伟达、谷歌、微软。国内科技巨头不遑多让，百度早在2019年就已在布局且悄然将对应技术融入到搜索等业务中。2023年，生成式AI产品的走红则表明预训练大模型技术已趋于成熟，强人工智能时代业已来临，AI能力正在从“感知智能”升级到“认知智能”，这正是李彦宏在发布百度财报时所说的“即将到来的AI拐点”的深意所在。
    搞清楚生成式AI产品的本质是预训练大模型加持的强AI应用后，就很容易理解“为什么百度可以快速做出来文心一言”了，因为百度已在相关底层技术上积累多年，特别是NLP和预训练大模型。
    预训练大模型对AI认知能力的提升，最突出的体现就在NLP技术领域。自然语言处理（NLP， Natural Language Processing）被称为“人工智能皇冠上的明珠” ，它是AI的基石技术，由于搜索引擎底层是NLP，因此全球顶尖的AI公司在搜索业务上都有很强的建树。
    在NLP领域，中国没有一家公司的水平跟百度在一个级别，更别说挑战了。在本世纪初百度诞生时，NLP就已成为其搜索业务的核心技术，2010年百度成立了自然语言处理部初探AI，此后依托知识图谱在语音、图片等AI技术上长期投入。
    基于在知识图谱、NLP、深度学习等AI技术上的多年积累，2019年3月，百度发布知识增强的语义理解框架ERNIE（文心），给预训练大模型技术的布局打下基础。ERNIE（文心）一举登顶全球权威数据集GLUE榜单，首次突破90分大关，刷新该榜单历史。2021年9月百度发布PLATO－XL，这是全球首个百亿参数的对话大模型，再次刷新开放域对话效果。

    AI技术的研发就像烧水一样，比100°更难的是从0°到99°，因其所需时间更长、所要热量更多，但人们更容易关注到100°沸腾的光芒万丈，却忽视0°化冰再到99°的长期努力。不论是OpenAI做ChatGPT还是百度做文心一言，都不是从0到1，而是厚积薄发的结果，做出来理论上只需要“临门一脚”。正因为百度在AI上数十年如一日的大力投入，因此它可以在2019年就发布强大的ERNIE，也可以在短时间推出文心一言。
    文心一言这件事，只有百度能做好
    一夜之间，生成式AI产品红得发紫。除百度已宣布将在3月推出文心一言外，还有多家科技公司宣布已经或者即将布局。据新经济产经新媒体“价值研究所”不完全统计，进入2023年以后表态正研发ChatGPT相关产品、应用，或将相关技术引入业务的国内企业已超过百家，但细究其中公司的业务属性与技术能力，也不难发现“蹭热度的多，能打的没几个。”

    生成式AI产品潜力无穷，但能做出类似应用且可将其商业化的公司却凤毛麟角。得天独厚的科技与金融环境，让美国有更多科技巨头乃至创业者有机会开发生成式AI产品——其中大多数将注定失败。但在中国市场，恐怕只有百度这样的技术沉淀深厚、资金实力雄厚、AI人才扎堆以及应用场景契合的科技巨头才有机会做文心一言这样的产品。
    技术层面，预训练大模型技术涉及到芯片层、框架层、模型层和应用层四层，难度极高，大多数创业者包括科技公司都处在“应用层”。
    前些年，涉足AI技术的初创公司不少，其中一些算法强悍的公司脱颖而出成为独角兽，原因在于深度学习人人都可参与研发探索，特别是在飞桨这样的深度学习开源平台出现后。
    然而，AI预训练大模型门槛却高了不少，因其具有“巨量数据、巨量算法、巨量算力”三大特征，是门槛很高的技术竞赛。对于任何企业包括巨头来说，打造一个大模型都不是一件容易的事情，需要收集海量数据、需要采买海量算力、需要进行大量研发，金钱、时间、人力投入同样“巨量”，正是因为此构建AI大模型的企业几乎都是财力雄厚、技术强悍的巨头——微软甚至宣称其用了价值10亿美元的超级计算机来训练其AI大模型。在“土豪”的科技巨头外，少数有一定科研经费和实力的机构推出了小众的大模型，但不具备工业化条件。
    正因为此，即便是科技巨头也不一定具备打造强势的AI预训练大模型的能力，微软最后也只得选择了多次投资OpenAI，如今得以将ChatGPT整合到Bing中再度挑战谷歌。
    在中国已发布顶尖预训练大模型的公司屈指可数，百度是其中最具实力的玩家，它在芯片、框架、模型、应用四大核心层均具有自主技术栈，数据、算法、算力与场景等AI基础要素都不缺，积累多年且都“很能打”：
    在算法层面，正如前文所言，百度十余年如一日地在AI上进行饱和式投资，如今已开花结果。除了基于NLP、知识图谱、语音、视觉、深度学习框架等基础AI技术外，百度2019年推出的文心大模型已迭代多代，从单一的自然语言理解延申到多模态，包括视觉、文档、文图、语音等多模态多功能。跟很多学术机构的大模型不同，文心大模型在百度核心业务以及第三方产业场景中不断锤炼，具备更强的泛化能力和性能，以最新发布的ERNIE 3．0 Zeus为例，该模型迭代于ERNIE 3．0，拥有千亿级参数。其已经具备智能创作等各类自然语言理解和生成任务，且公开数据集上小样本学习、理解和生成任务效果皆好于业界其他模型。

在算力领域，百度不只是拥有巨头们“人有我有”的服务器集群，还前瞻性地布局决定AI算力的高端AI芯片昆仑系列，其已在多场景实际部署几万片，在公司搜索业务中也已形成较强工程化实践，这些布局意味着百度不只是可以支撑预训练大模型所需要的算力，也将具备更强的成本优势，最终体现就是文心一言的“调用成本”将比其他相似应用低得多。

    在数据层面，百度不只是可以使用ChatGPT使用的互联网公开文本（如网页、百科、文章等），还可从自身搜索业务、超级内容生态中获取更加海量、真实、时效的数据，特别是中文数据，进而进行更加高效充分的预训练。
    在应用层面，百度在搜索、信息流、短视频等互联网核心业务外，已基于AI技术延展出智能云、智能驾驶、智能硬件等新兴业务，从财报透露的信息来看这些业务都将与文心一言充分融合，让文心一言更好落地的同时，反哺预训练大模型的进化。
    总而言之，从高端AI芯片昆仑，到飞桨深度学习框架，再到文心预训练大模型，百度在各个核心层都具备领先自研技术，不只是具备做文心一言的必要条件，也可以实现端到端优化，将其做得更好，真正落地到业务，应用到产品，惠及到公众。
    正因为此，对于大多数科技公司乃至大型公司来说，再去做一个“文心一言”这样的底层预训练大模型应用本质是“重复造轮子”，且大概率造不出来，就算耗时耗力做出来了恐怕也“造不好”，既然如此，基于百度文心一言开发强AI应用或许是最有效的方式。在发布财报时，百度也已表态将开放文心一言大模型，“支持更多企业构建自己的模型和应用，赋能交通、能源、制造等实体经济领域，实现生产效率的大幅提升。”
    文心一言商业化，百度采取“渐进式路线”
    当前，生成式AI应用商业化还在探索期，OpenAI的ChatGPT是迄今为止最风靡的AI大模型消费级应用，但其能否商业化乃至让OpenAI成长为一家商业科技巨头，还需要一些时间考验。当前其商业化的最大困扰就是计算成本问题，有媒体甚至分析称ChatGPT每回复一次，至少花OpenAI 1美分，如果面向公众长期开放，不论是搜索还是别的商业模式都将难以为继。有马斯克、微软、亚马逊等强力“背景”支持的OpenAI尚难支撑庞大的计算消耗成本，国内某学术机构推出的生成式AI类产品“一经发布就彻底翻车”也不让人意外了。
    百度走的则是另一条路：一边投资底层前沿技术、一边逐步将技术融入业务，渐进式的商业化探索或许不会“一夜爆红”，但却更加稳健可持续。
    正如百度在发布财报时所透露的那样：百度计划将多项主流业务与文心一言整合，让更多人可以从预训练大模型、强人工智能这样的技术得到实惠，而不仅仅是“想方设法体验一次长个见识、多个谈资”。
    在发布财报时，百度已明确接下来要将文心一言应用到以下核心业务：
    1、搜索引擎。
    早在2022年11月我就和百度技术团队有一次沟通，当时百度就已将文心大模型应用在搜索这一核心业务中，在2022年万象大会上，百度发布了跨模态大模型“知一”和新一代索引“千流”。“知一”可理解视频、文字、图片、信息流等全网形态各异的资源，使得搜索不再受限于信息的形态。“千流”则可对海量内容进行索引，更快地筛选出搜索相关的答案，相较于传统搜索引擎而言，成本降了一半、速度快了两倍。
    在“智能搜索＋智能推荐”的双引擎模式下，百度搜索每天响应来自100多个国家、几十亿次的搜索请求。随着搜狗等老牌玩家出局，中国搜索市场已“剩者为王”，百度最新财报显示，百度移动生态流量强劲，依然是贡献经营利润和现金流的重要来源。第四季度百度移动端搜索查询次数和信息流分发量继续实现同比两位数的增长。
    百度已宣布会将文心一言率先应用于搜索，“重塑信息的生成和呈现方式，创造下一代互联网流量入口”，在罗超频道看来，此举将影响百度下一个十年：
    一方面这有利于百度拥抱乃至引领下一代搜索形态，实现李彦宏所说的“代际升级”。
    届时百度文心一言在搜索的呈现，到底是类似于ChatGPT这样的单一对话界面，抑或全新的互联网产品形态，眼下尚不可知，但可以确定的是我们会看到一个更加接近于“框计算”的全新搜索引擎。早在2009年李彦宏就在百度技术创新大会上提出了“框计算”的概念，他当时的畅想是这样的：
    “框计算”给用户提供基于互联网的一站式服务，是一种简单可依赖的互联网需求服务模式，用户只需要在框中输入服务需求，系统就能明确识别这种需求，并将需求分配给最优的用户或者内容资源提供商处理，最终返还给用户匹配的结果。

    这不就是人们对文心一言的期待吗？2009年业界没人提及AI概念，一年后百度成立自然语言处理部布局AI，一直坚持到十余年干到了AI2．0时代，基于预训练大模型这一技术，百度终于有望将当年的“框计算”从梦想变为现实。
    另一方面，百度前些年一直在验证预训练大模型对搜索体验的改善。接下来，百度搜索融入更强大的文心一言后，一定会直接升级乃至刷新用户体验，这会直接体现在百度移动生态用户数与市场规模的进一步增长上。

    还有，融入文心一言后，百度搜索将不再只是提供“答案”的简单可依赖的搜索引擎，而是会延展出更多价值，如创作特定内容，智能旅行助理，智能健康助理等等，换言之，搜索引擎的外延将被文心一言不断拓宽，百度一直追求的从“连接人与信息”到“提供内容与服务的智能引擎”的升级也将加速实现。
    2、智能云。
    文心一言底层是智能对话生成式AI以及预训练大模型技术，在强AI时代，这些将成为各行各业的基础设施。百度已明确会将文心一言通过智能云对外开放，这将进一步强化百度智能云的“AI”标签。IDC报告显示，2022年上半年百度智能云在AI公有云服务市场稳居第一，这已是百度智能云连续四年市场份额第一。

    整合领先的AI预训练大模型技术，将文心一言的生成式、对话式强AI能力整合到产品对外提供，将进一步巩固百度智能云在“智能”赛道的地位。基于文心一言，百度智能云可实现全新的智能客服、智能决策、智能交互等能力，进而升级现有AI标准化解决方案，助力金融、通信、城市、交通等产业的客户抓住大模型和生成式AI背后的强AI技术红利。
    “智能”是百度智能云的差异化竞争力，这让其不需要去跟公有云厂商在算力、存储等IT资源维度“内卷”同质化竞争，而是可以给产业带去普惠的AI能力，通过助力客户基于AI降本增效、转型升级和技术创新获得高质量增长。马化腾在去年底的内部讲话中也明确腾讯云不care份额排名，可以说不再规模优先已是云计算行业的共识，其实百度智能云早已意识到这一点，2022年就已不再规模优先，财报显示2022年其通过复用标准化解决方案以及从低利润率项目中转移，实现了“利润率持续优化，业务健康度进一步提升”。
    除了搜索与智能云外，百度旗下的小度、智能驾驶等AI强相关业务，都将融入文心一言形成更强的竞争力。其实对百度来说，不管什么业务融入文心一言，本质都是AI战略的持续落地，因为ChatGPT、文心一言本质还是AI技术，只不过是基于预训练大模型的全新一代AI技术而已。布局AI前沿技术、渐进式融入核心业务场景，也一直都是百度做AI的理念。
    百度AI不是最快的，但却可能走得更远
    我很早就在关注国内的预训练大模型应用情况，与百度、阿里、浪潮等玩家的对应团队有持续交流，在观察到巨头们不约而同地布局预训练大模型后，2022年11月我在一篇文章中就有一个小小的预判：“AI 大模型的 AlphaGo 事件即将发生”：新技术积累到一定时候就会迎来大规模爆发的临界点。从 AIGC 应用、生成式 AI 的爆发来看，AI 大模型＂AlphoGo 战胜李世石之于深度学习＂这样的临界点即将来临。
    现在看来，生成式AI应用在2023年的爆红以及呼之欲出的文心一言，都算得上这样的标志性事件，预训练大模型一下就进入了众人视野。
    其实，当时百度就可以做出生成式AI应用，百度以及科技巨头都没做出来的原因，不是技术不如OpenAI，而是因为“时机不成熟”。OpenAI不是科技巨头，它没有商业的压力，抱着尝鲜探索心态的用户能接受一些体验的不成熟。
    而从谷歌以及国内某高校匆忙上线的类似产品因体验问题“翻了车”来看，科技巨头将新技术落地到大众消费级产品上时要慎重，因为产品对外提供服务就有对应的责任，说直白点，搜索结果只有一条还出错时，用户是会骂娘的。现在百度等到预训练大模型技术相对成熟时“跟着出牌”，我认为是一种负责、务实的表现，没什么不好。
    当然，百度得以不急不躁地做文心一言，也是因为占据了天时、地利和人和。在美国，ChatGPT以及基于ChatGPT的Bing等产品都在事实上挑战谷歌，谷歌不得不仓促应战。在中国，百度没有挑战者，ChatGPT不提供服务，而当年有机会做出文心一言类似产品的搜索引擎对手们基本都偃旗息鼓了，在搜索赛道，在中文AI战场，说百度如今“拿着望远镜找不到对手”恐怕也不夸张。
    对百度来说，当下面临的没有挑战，只有机会。只不过机会并不是ChatGPT带来的，而是AI技术发展到新的阶段，也就是基于预训练大模型的认知智能、强人工智能“拐点”到来后的技术周期机会。没有ChatGPT的爆发，百度也一直在默默布局相关技术，低调地将技术成果应用到搜索、应用到智能云等业务，只是现在被ChatGPT往前推了一把，将会加快进程。
    随着文心一言内测与开放，基于紧贴业务的渐进式商业化路线，百度将建立起开发者及用户调用和模型迭代之间的飞轮，文心一言也将越来越聪明，在局部特别是在中文领域超越ChatGPT也是确定性的事件，毕竟在全世界范围内，还没有一家公司的中文自然语言处理能力以及中文AI技术，能达到百度的水平。

观察百度多年，我发现这确实是一家有些“轴”的公司。有人说百度一直在变战略，其实我发现百度一直都没变，核心业务从来没变，研发战略从来不变，AI技术路线一直不变。就拿在预训练大模型技术上的布局来看，百度的做法跟当年没什么区别：2006年谷歌AlphaGo战胜李世石轰动全球，很多人说百度落伍了，其实百度早已吭哧吭哧地将AI技术融入到搜索、知道、地图等核心业务中。百度一直有着务实的“工程师文化”，它很重视技术的应用而不care噱头，在很多AI技术的落地上它不一定是跑得最快的但却是走得最远的，它愿意坐冷板凳，在AI技术上十年如一日地笃定投入，创造属于自己的机会，持之以恒地积蓄能力，到了该出手时又毫不犹豫。
现在，百度的大时代，终于来了。