百度终于等到ChatGPT

新摘商业评论

    十年1000亿,百度在深度学习、NLP、语音、大数据等技术研发上已经应用到搜索、金融、电动汽车等业务,但关于AI的商业价值还没有哪个产品能直观显示。
    作者/何必
    出品/新摘商业评论
    在“ChatGPT热”已经全球风靡两个月之后,百度决定入局。
    近日有多家媒体都报道,百度将在3月份推出类似OpenAI旗下ChatGPT的人工智能聊天机器人服务。
    但事实上,早在去年12月,李彦宏在一场面向全体员工的内部直播中就提到过ChatGPT这项技术及其前景。
    “我很高兴我们每天都在琢磨的技术能够吸引这么多人的关注,这并不容易,”同时他也表示,“技术能做到这一步了,但是它会变成什么样的产品,产品能满足什么样的需求,这个链条上还有很多不确定性。这个事情很难,但百度必须要做。”
    也无怪乎百度会如此激动,ChatGPT已经成为历史上增长最快的消费应用,在推出两个月之后,月活用户达1亿。就算是TikTok达到这一数据也用了大约9个月。
    百度作为国内AI领域的代表企业,一度以“十年累计投入超过1000亿,其中核心研发的投入占比远超其他互联网大厂”宣称,自然不会错过这次由ChatGPT引爆的AIGC概念相关布局。
    但ChatGPT式的产品,能给百度带来怎样新的故事?是否能成为百度对外标榜技术基因、并引以为傲的证词?百度曾经定下的“all in ai”路线又是否到了收获的季节?
    一、ChatGPT,引领搜索体验的代际变革
    ChatGPT本质上还是自然语言生成式AI,能提供高度智能的对话式问答结果,这显然很适用于搜索场景。
    
    比如你问它如何看待百度进军ChatGPT,它也能有模有样的回答。
    作为一款聊天机器人,ChatGPT使用了Transformer神经网络架构,训练数据来自包括维基百科,以及真实对话在内的庞大语料库。
    这使得它可以轻松与人类进行各个领域的对话,回答各种问题,无论是写代码改bug、回答科学问题,还是写论文、写文章都不在话下,甚至可以做到与真正人类几乎无异的聊天场景进行交流(如果不去计较它很多时候会一本正经地胡说八道的话)。
    
    图源:知乎张俊林
    而百度作为国内最大的搜索引擎,还在人工智能领域摸爬滚打整10年,在ChatGPT刚火的时候,业内人士就猜测百度会跟进。
    正如李彦宏所说:“这很宏伟,很激动人心。 但我们认为它是可实现的,因为技术已经到了临界点。类似ChatGPT这样的技术很火,如何用在搜索场景上,这是比技术本身更难探索的。怎么能把这件事情做出来,让每天有几亿人从中受益,让他们的效率有明显的提升?未来一年,在这方面我们非常有机会。”
    有接近百度的人士跟媒体反应,去年12月后,百度就“快马加鞭”投入相关研发,由搜索(MEG)和技术中台(TPG)团队牵头,呈现形式将会是生成式搜索,也就是将搜索和ChatGPT结合。
    据悉,这一应用还并未命名,一开始还是会嵌入在搜索服务中,但有别于传统的网页链接显示搜索结果,它将会提供的更对话化、情境化的回复。
    事实上,今年1月初的百度Create AI开发者大会上,百度搜索就宣布将基于百度自研的生成式模型,升级“生成式搜索”能力。还表示,搜索与生成式AI之间的关系更像是互补而非替代,百度从2021年就开始尝试把AIGC与搜索两者结合起来。
    如今在百度将推出“国产ChatGPT”消息出来后,2月1日,百度美股早盘涨逾15%,同时带动相关概念股上扬。
    
    尽管百度官方没透露太多消息,但市场还是用脚投票,在不同资本市场信息平台上,已有投资者纷纷提问百度相关公司,是否有参与百度ChatGPT相关项目的合作,足见对其的期待。
    理由也很简单:放眼国内,不管是说对AI的技术积累,还是说在自然语言领域的经验优势,百度都首屈一指。
    百度在人工智能技术领域深耕多年,有芯片、框架、模型、应用四层技术栈 。其中,文心系列大模型参数规模达到2600亿,表现超越谷歌的T5和OpenAI的GPT-3,是全球最大的中文单体模型,在行业产业已经获得普遍应用。
    并且ChatGPT最显性的价值与落地场景,目前来看还是搜索。对百度来说,“中国ChatGPT”一旦做成,借用生成式搜索的能力,由此或将引发一连串的蝴蝶效应。
    这也是为何李彦宏把该项目称为是“引领搜索体验的代际变革”。
    二、从搜索到生成,是“危”也是“机”
    对于自身搜索领域的技术趋势,百度其实是有一定预期的。
    在1月初的媒体沟通会上,百度搜索架构师辜斯缪就提出三点:第一是搜索从信息检索到检索+生成的混合系统。第二是搜索变成跨模态的理解和交互,搜索将以图片、视频、音频等各种媒介形式理解用户输入的信息。第三是在知识的理解和组织基础上完成搜索。
    辜斯缪举例道,生成一个像“高智商”或知识储备丰富的人的人工智能,将百度搜索中的信息理解处理后提供给用户,“我们认为它最终提供的服务质量会远高于现在待机下的搜索服务质量”。
    这正是ChatGPT在做的事。
    事实上,我们现在使用的搜索产品只是当时互联网技术的一种妥协。
    在搜索框里输入关键词,当找不到合适的答案时,再换几个关键词,这一行为习惯的背后是,机器并不能很好地理解自然语言,只能退而求其次,通过信息的重合度来展现不同的网页和答案。
    而现如今ChatGPT已经让人们见到机器理解自然语言的能力有多强大,让人工智能直接查询问题并理解和组织答案的可能性已经有了。
    自然搜索引擎的服务能力提升也到了一个临界点,搜索引擎的未来,不仅仅是索引网页与链接,而是为每一个查询生成相应的摘要、回答。这就是从搜索到生成。
    而ChatGPT的价值,从微软和谷歌的反应中也能略窥一二。
    微软一边说要把ChatGPT整合到必应里,一边又表示在Office三件套里也将添加ChatGPT功能,以实现每个人的“PPT自由”,甚至于还放出消息说要追加OpenAI100亿美元的投资,大有把其当作三十年来最有回报项目之势。
    谷歌则是紧急发布“红色警报”,多次举行围绕谷歌人工智能战略的会议,让高管反思为什么自家AI产品进展缓慢,并指示公司的许多团队重新集中精力解决 ChatGPT对其搜索引擎业务构成的威胁。
    连已经处于半退休状态的两个创始人都被召回,牵头举行关于AI和搜索两个领域如何整合的的闭门研讨会。
    所以,作为同样处境的全球最大的中文搜索引擎百度,布局ChatGPT也是一种必然。百度必须参与这场前沿竞赛,否则时代就会跨过它,继续前进。
    三、百度需要ChatGPT
    尽管业界现在对于ChatGPT能否取代搜索引擎还是众说纷纭,在成本侧和内容质量侧,ChatGPT还有难以跨过的技术鸿沟。但不少业界人士都认为,生成式AI未来大有可为。
    而首先就会影响搜索引擎。摩根士丹利在2022年12月发布的报告中提到,ChatGPT可能会破坏谷歌作为互联网用户入口的地位。
    一旦未来ChatGPT的内容质量和训练成本得到进一步改善,像谷歌、百度、搜狗、360这种有搜索业务的企业将成为第一个被冲击的对象。
    百度不可能坐视危机发生而无动于衷,最好的防守就是进攻,抢先布局才能让局面可控。
    作为一直都想抓住前沿风口的百度来说,已经在芯片、自动驾驶、大模型、AIGC、深度学习等领域投入太多,财务上却还是靠着搜索业务支撑,新业务大多还没看到商业化落地的例子。
    如果百度能在搜索到生成上取得足够大的先发优势,这无异于又是一张互联网新时代的船票。
    另外,对于百度而言,ChatGPT的另一个价值在于推动AIGC发展。相比PGC、UGC,AIGC(AI生产内容)具有效率和成本上的优势。
    在去年的AI热营销峰会上,百度就重点介绍了自家的AIGC内容工具,并表示“未来,AIGC 将颠覆现有内容生产模式,可以实现以十分之一的成本,以百倍千倍的生产速度,创造出有独特价值和独立视角的内容”。
    而更进一步,AIGC的发展又能让web3的世界更清晰,甚至于AIGC 会成为 web3 基础的技术架构。因为web3所强调的“人人都是互联网的中心,互联网数据的所有权归于每个人”,正是需要工具让每个人都能产生个性化的内容。
    同样,在云业务上,百度作为一直强调具有AI差异优势的云厂商,如果把ChatGPT的大模型与云计算结合,这又会给云市场带来更多新变量。
    微软已经在这样做了。开发者可以在微软云上直接访问OpenAI的大模型,然后根据特定业务进行调整,高效低成本地开发AI应用。
    
    当然,技术能够提供怎样的价值,往往在于如何将其封装进产品,对生成式 AI 也是如此。
    十年1000亿,百度在深度学习、NLP、语音、大数据等技术研发上已经应用到搜索、金融、电动汽车等业务,但关于AI的商业价值还没有哪个产品能直观显示。
    早前李彦宏提出的“框计算”概念,想把百度打造成一切信息和服务的入口,现在看来就是小程序加上ChatGPT。
    当技术已经进步,老船长是否还能再次扬帆起航,答案写在不久的将来。