ChatGPT混战,谁会拥有话事权?
洞见新研社作者 | 辰纹
来源 | 洞见新研社
“未来十年,AIGC(人工智能自主生产内容)将颠覆现有内容生产模式。可以实现以十分之一的成本,以百倍千倍的生产速度,去生成AI原创内容。”
不得不说李彦宏对技术趋势的判断还是非常准的,去年7月在百度世界大会上的发言一语成谶。
李彦宏为AIGC背书不到一个月,AI绘画作品《太空歌剧院》战胜诸多人类画师,拿下美国科罗拉多州博览会美术竞赛一等奖,此后很长一段时间内,无论是严肃的学术会议,还是互联网的角角落落,AI绘画都是热度极高的话题。
今年开年,ChatGPT一夜爆红,科技巨头争先入局。
百度类ChatGPT产品“文心一言”将在3月上线,消息发布当日,百度股价盘中一度涨超15%;谷歌版ChatGPT—Bard 8日首秀翻车,谷歌股价重挫8.28美元,市值缩水超千亿美元(合人民币7202亿元)。
ChatGPT带动的不光是AI技术的一大跨步,更是一众科技巨头们对未来产业的争夺。
01 一年一个热点,今年轮到ChatGPT
都说互联网有记忆。
从2021年的Clubhouse,到2022年的AI绘画,再到当前的ChatGPT,一年一个热点,大有“皇帝轮流坐,今年到我家”的势头。
2021年即时音频社交软件Clubhouse大热时,带动了“声音概念股”大涨,这股热潮由国外冲击到国内,荔枝、映客等玩家狠狠的收获了一轮红利,当时有关Clubhouse的创业风口也甚嚣尘上。
可是Clubhouse的热度并未持续很长时间,几个月后就偃旗息鼓,逐渐淡出主流视野直至成为记忆尘埃。
根据Sensor Tower的数据显示,Clubhouse在2021年2月爆红当月下载量为960万次。3月的下载量掉落到270万,四月的下载量仅有92万,大约是2月的1/10,暴跌90%。
AI绘画的热度由《太空歌剧院》拿下美国科罗拉多州博览会美术竞赛一等奖的事件引爆,之后推特、Facebook等社交媒体又接力了一轮助推,引发了大量用户围观。
在B站,《七里香》《孤勇者》《加州旅馆》《波西米亚狂想曲》等热门歌曲的MV都被UP主们用AI绘画的作品作为素材重新创作了一次,天马行空的想象与赛博朋克的迷幻相结合,制造了无数话题。
然而AI绘画的热度维持的时间也不长,当用户们的新鲜感过去之后,整个行业似乎又陷入了平静。
如今,公众关注的热点来到了ChatGPT。
其实,无论是Clubhouse还是AI绘画,或是ChatGPT,追溯它们成为热点的过程可以发现,最开始都是在C端引爆,经C端流量的引导持续发酵,然后发现技术/产品在某些行业或特定场景落地蕴含巨大价值,接着就是巨头们入场竞逐。
像Clubhouse的第一批用户包括美国影星艾希顿古查(Ashton Kutcher),加拿大饶舌天王德雷克、影星凯文·哈特(Kevin Hart)和脱口秀女王奥普拉等,吴彦祖、苏打绿、林俊杰等港台明星、罗永浩等科技圈名人也在Clubhouse开有帐号。
马斯克的入场更是给Clubhouse打了一针强心剂,名人效应下,引发了大量用户跟随加入,带来了用户数火箭般的蹿升。
AI绘画则是由社交媒体完成扩散,ChatGPT同样是被大量C端用户的口口相传而推向顶峰的。
京东集团副总裁何晓冬对ChatGPT的评价非常高,认为ChatGPT是第一款真正意义上的人工智能原生产品,“就像第一款iPhone(苹果公司手机产品),一出来就展现出高完整度,高体验性,高平台性”。
与传统的人机交互不同,ChatGPT最大的创新在于文本内容的生成,通过交互式对话来逐步理清用户的意图,尤其是一些比较复杂的意图,ChatGPT连续多轮人机交互,直至完全理解用户意图并给出相应的回答。
也正是因为如此,ChatGPT推出仅两个月,在2023年1月末的月活用户就已突破了1亿,成为史上用户增长速度最快的消费级应用程序。
之前最快破亿的TikTok,达到这一成绩时花了9个月。
风口之下,巨头们都坐不住了,Google、Meta分别推出各自的聊天机器人Bard和BlenderBot,中国企业百度、阿里、京东、科大讯飞等企业也纷纷发布了各自的ChatGPT产品计划。
围绕ChatGPT的大战一触即发。
02 对ChatGPT保持乐观,但也不要太乐观
比尔盖茨曾经说过:人们总是高估新技术出现的第一个五年,低估第二个五年。
像AI、自动驾驶等新技术都经历过先被追捧,后被看低的过程,然而ChatGPT似乎正在打破比尔盖茨的这个判断。
从技术的进化趋势,以及更长的时间维度来看,ChatGPT的价值不应被低估,主要因为相比过去的AI技术,ChatGPT具有更强的自学习能力,可以基于大数据集自己生成内容,这是一个非常巨大的跨越,只是从ChatGPT目前所暴露出的问题来看,我们需要对当前的狂热保持谨慎乐观。
大量的测试中,很多用户已经发现ChatGPT存在结果不稳定、推理能力有限的缺点,例如询问现在的美国总统是谁,会回答奥巴马或特朗普,但又能回答出拜登是第46届总统,模型中有事实存在,但ChatGPT却无法推理出正确答案。
致命一击的是,Google 聊天机器人Bard 2月8日首秀时犯下事实性错误,这种公开场合的翻车,更加加深了公众对ChatGPT技术的不信任感。
结果不稳定,频繁犯错直接导致ChatGPT无法落地对结果准确性要求高的业务,最终会逐渐边缘化,成为辅助应用协助人工审核,或者干脆作为一个娱乐性工具而存在。
以对人力需求很大的保险业为例,截至2022年6月30日,全国保险公司在保险中介监管信息系统执业登记的销售人员高达570.7万人。
专业的保险配置需要结合客户家庭收支、预算情况、保障需求、产品优势等层面来综合考虑,这是目前AI技术无法达到的,也是保险经纪人/代理人的核心价值。
虽然ChatGPT目前在自然语言处理和学习效果上比其他框架有所提升,但其对专业问题的理解和回答上与人类专家有较大差距,中国保险学会特聘保险科技专家彭勇就认为,“ChatGPT短期内还只能替代一些较简单的工作,随着技术进步,后期替代比例才会逐渐提高”。
除此之外,由于模型的二次训练成本过高,ChatGPT知识更新频率无法与现实发展同步,目前ChatGPT训练的知识库还只停留在2021年。
为了达到当前的效果,OpenAI用了45TB的数据量、近万亿个单词(相当于1351万本牛津词典)来训练模型,而训练这样一个包含1750亿参数的语言大模型,至少需要上万个 CPU/GPU 24小时不间断输入数据,部分高质量标注数据,还得依靠博士级别的专业人士来完成。
小冰CEO李笛曾用人工智能小冰举例,如果小冰用ChatGPT这类方式运行系统,小冰每天承载的交互量就需要花近3亿人民币的对话成本。折合成一年,就是千亿元的成本。
因而除了巨头之外,对于创业公司尤其需要关注的一点是,在还没有确定商业模式之前,企业前期不计成本进行ChatGPT研发,后期能否带来希望中的回报,是需要慎重考虑的问题。
更具挑战的是,有一篇来自12个国内外研究机构共同发表的关于智能计算的论文中指出,AI模型所需算力每100天就要翻一倍,这个速度远超摩尔定律(集成电路上可容纳的晶体管数目,约每隔两年便会增加一倍)。
如果对未来进行估算,即AI模型所需算力五年内将增加超过100万倍,如今摩尔定律都正在走向失效,如何满足高速增长算力的需求,没人能够回答这个问题。
03 关乎未来的技术争夺战
回到ChatGPT的竞争,就其技术内核而言,并没有太多“秘密”。
Meta公司首席AI科学家Yann Lecun公开表示,ChatGPT没有令人印象深刻的技术创新,其最大的“创新”其实是将现有的技术与体验进行了更好整合,带给用户以及开发者非常棒的体验。
事实也是如此,ChatGPT的底层技术来自于Google提出的Transformer架构,同时还使用了大量在谷歌内部使用(由 DeepMind 发明)的强化学习技术,大量开源的架构、模型以及数十年来公开的论文等,为ChatGPT的出现创造了良好的基础,“它不是真空出现的”。
这也是ChatGPT发布后,包括百度、阿里、华为、腾讯、网易、字节、科大讯飞等内在的中国公司能够几乎前后脚发布自己的ChatGPT产品的原因所在,在一定程度上来说,这些中国公司因为其业务生态和技术专长的不同,在ChatGPT方面反而有自己的差异化优势。
比如百度,一直做着与GPT类似的事情,只是未将技术进行包装,做出像ChatGPT这样的产品来“炫耀”。
早在2019年,百度就做出了产业级知识增强文心大模型ERNIE 1.0,这一技术创新与“同类”GPT-1、BERT的差距都只有几个月。
在文心的发展过程中,2021年迭代的ERNIE 3.0大模型即拥有千亿参数;与超强算力方联合的鹏城-百度·文心作为一款融合了自然语言理解和自然语言生成的大模型,其参数量达到了2600亿,相对GPT-3和ChatGPT提升了50%。
百度发布“文心一言”时,就公开表示,百度在人工智能四层架构中,有全栈布局。包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。文心一言,位于模型层。
同时,在与ChatGPT深度关联的NLP领域,百度也是行业内公认的第一。
阿里巴巴达摩院2020年初启动中文多模态预训练模型M6项目,其发展速度相当惊人,同年6月推出3亿参数的基础模型,到了2021年1月时,模型参数规模达到百亿级别,成为世界上最大的中文多模态模型;2021年5月,具有万亿参数规模的模型正式投入使用。
去年,阿里AliceMind模型更是在CLUE榜单的AI中文语言理解任务上得分首超人类,获得了86.685高分。
IDC近期发布的《2022 H1中国AI云服务市场研究报告》显示,阿里AI在ChatGPT相关的语音语义领域市场份额达到31.98%,其中阿里对话式AI、语言AI、语音AI市占均为第一。
至于华为,则有业界首个千亿级生成和理解中文NLP大模型——鹏城盘古大模型。
针对大模型的产业化,华为发起了智能遥感开源生态联合体、多模态人工智能产业联合体,智能流体力学产业联合体等,以联合体的模式把科研院所、产业厂商等结合起来,更好地让大模型产业形成正向的闭环回路。
ChatGPT的热潮虽然是由美国公司带头掀起的,占主导地位的也是微软、谷歌和Meta这几个巨头,但中国企业的跟进速度并不慢,就目前所演化成的态势,ChatGPT并不是一项简单的由技术革新而带来的商业机会,而是关乎到自主掌控AI关键技术的中外竞争,更加直白一些,中国必须要有自己的ChatGPT。
百度官宣3月上线“文心一言”后,李彦宏就说过,无论是AIGC还是ChatGPT,都是AI发展到一定阶段后新的机会。“怎么把这么酷的技术,变成人人都需要的好产品,这一步其实才是最难的,最伟大的,也是最能产生影响力的。”