ChatGPT之战,科技“托拉斯”之战

芯流智库


    2022年11月30日,微软旗下的OpenAI发布ChatGPT,5天内涌入100W用户。
    他拥有持续的上下文对话能力,同时支持文章写作、诗词生成、代码生成等能力。
    这个与Siri、小爱、小度、小冰等完全不在一个level的聊天机器人,被认为是“通用型人工智能”的开端。
    面对它的诞生,有人欢喜有人愁。微软和谷歌短兵相接,国内的百度、阿里等AI大厂们也在紧绷着弦加速攻坚。
    为什么ChatGPT会引发如此大的轰动?它的背后有着怎样的技术铺垫?被甩在后面的中国科技产业,又该怎样奋起直追?
    本文将分为以下两部分阐述:
    1. ChatGPT是怎样炼成的?
    2.中国版ChatGPT还有多远?
    
    ChatGPT是怎样炼成的?
    
    最先看到ChatGPT,不是在科技新闻,也不是媒体官宣,而是在朋友圈刷屏的对话截图中。面对稀奇古怪的问题,对面总能给出简洁严谨又不失情感的回答,有如训练有素的万能客服。
    前微软亚洲互联网工程院副院长、现小冰公司CEO李笛说,ChatGPT之所以出圈,是源于它被普通用户观察到,并超过了人们对人工智能的预期。
    上一次现象级的AI浪潮还是2016年,AlphGo击败李世石。六年过去,故事的主角从谷歌换成了微软的OpenAI。
    ChatGPT全名为Chat Generative Pre-Trained Transformer,使用基于GPT-3.5架构的大型语言模型(LLM),既能够写诗歌、编代码,还能创造剧本、帮你面试出题、发表论文,以及实现更广泛的搜索服务等。
    ChatGPT的诞生,开启了“AIGC元年”。所谓AIGC,即AI Generative Content,是继UGC、PUGC之后,由AI直接生产内容的技术形式。ChatGPT使AIGC在各行各业的商业化落地有了具象的出路,人类的生产力迎来解放革命仿佛就在不远的未来。
    目前,如Siri等著名AI实际上都大同小异,是基于若干个专业Agent复合而成的,也就是说单个Agent只会做份内的活,在AI判断了用户的意图是生成代码、文学创作、图片绘制、视频制作等等后,就将命令发给对应的Agent去解决。
    而ChatGPT是一个另类,它的背后是一个全能机器人(大语言模型),用户借助文字下达命令(Prompting,提示/指示),ChatGPT将自主适应不同领域的任务。
    尽管目前还存在不够智能的时刻,但ChatGPT已经具备了“通用型人工智能”的雏形。
    十足的科幻感背后,也离不开实打实的高投入。ChatGPT最突出的“通用性”,依赖于背后的通用大模型。
    模型的本质是一套计算公式和数学模型,参数可以视为模型中的公式。参数量越大,模型越复杂,预测也越精准。大模型就是参数量极大的模型,目前业内主流的AIGC模型动辄有着千亿、万亿级的参数量。
    ChatGPT是基于GPT-3模型进行优化所产生的。OpenAI在训练GPT-3时,用了45TB的数据量、近 1 万亿个单词,约合到1351万本牛津词典。
    这就使得大模型的训练和推理高度依赖芯片。缺少芯片会造成算力不足,进而无法处理庞大的数据量和模型,最终导致人工智能变成“人工智障”。
    高算力是ChatGPT的地基,其中最重要的搭建者是微软和英伟达。
    2019年,微软为OpenAI打造了Azure AI超算平台,该平台性能位居全球前五,拥有超过28.5万个CPU核心、1万个GPU、每GPU拥有400Gbps网络带宽的超级计算器,成本高达数亿美元。
    此外,2019年微软向OpenAI投资10亿美元。2021年微软再进行了一轮未透露金额的投资。今年1月,微软宣布将在未来数年陆续向OpenAI投资100亿美元。
    芯片方面,英伟达的A100/H100是目前性能最强的数据中心专用GPU,市面上几乎没有可规模替代的方案。据瑞银分析师蒂莫西·阿库里分析,ChatGPT已导入至少1万颗英伟达高端GPU来训练模型。
    微软提供资金与算力支持,英伟达供应高性能芯片,Buff叠满的OpenAI沉淀了数年,才一举惊艳了世界。这其中展现出的,一是OpenAI敢于在无人区死磕的工匠精神,二是美国强大的科技托拉斯力量。
    托拉斯(trust),是由生产同类商品或在生产上有联系的大企业,为垄断某些产品的产销以获取高额利润而联合成的一种垄断组织形式。
    OpenAI的成功,根本上是美国科技托拉斯的成功。下游的终端应用、上游的芯片和中间的技术研发三大托拉斯,共同催生了ChatGPT:
    微软作为下游应用巨头,其不仅在硬件和AI上投入大量研发资金,还频频收购游戏等行业的多家科创企业,整合前沿科技的技术与生态,锻造自己在算力时代的综合竞争力。
    英伟达在数据中心GPU市场占据超过90%以上的份额,其供应的底层芯片是AIGC赛道不可或缺的稀缺资源。包括特斯拉、Facebook在内的企业,都采用英伟达的A100芯片组建AI计算集群,采购规模均超过7000枚。
    而研发的主体OpenAI,由埃隆马斯克牵头出资创立,山姆?阿尔特曼、彼得?蒂尔、雷德?霍夫曼等一众硅谷大佬加盟,最开始即定位为非营利性组织,剑指AGI(通用人工智能)。
    中国能否在新一轮AI浪潮中追上美国,根本上取决于科技托拉斯的力量。
    
    中国版ChatGPT还有多远?
    
    ChatGPT在线上客服、搜索引擎、内容生产等方面展现出的巨大潜力,让国内外科技公司纷纷加码布局训练大模型,一场AIGC军备竞赛打响了。
    2月2日,微软宣布旗下产品将全线整合ChatGPT,同日ChatGPT宣布推出付费订阅服务。
    2月3日,谷歌向AI初创企业Anthropic投资约3亿美元,并宣布将推出类似于ChatGPT的大型语言模型。
    2月7日,微软发布新品,推出新版搜索引擎必应和Edge浏览器,新增了和ChatGPT一样的AI语言模型GPT3.5。
    大洋彼岸,北京西二旗的科技园里,百度的算法工程师们也在彻夜备战,所有的核心人才和高端算力资源全部调用给了大模型“文心一言”。
    作为最大的中文搜索引擎,百度在人工智能的四层技术架构上实现了全栈布局:
    模型层,百度在2019年推出了知识增强的语义理解框架ERNIE(文心大模型),并广泛应用于阅读理解、情感分析、智能搜索问答、视频推荐、CTR预测等领域。目前,ERNIE系列模型经过了多次的迭代,具备了较强泛化能力和性能。
    框架层,百度的深度学习飞桨平台在2022年底已凝聚535万开发者,基于飞桨创建了67万个模型,服务20万家企事业单位,构建起了繁荣的AI技术生态。
    芯片层,百度自研AI芯片“昆仑芯”已在多场景实际部署几万片,让文心一言底层算力有所保证。
    应用层,百度的搜索服务每天响应几十亿次真实的用户使用需求,每天进行1万亿次深度语义推理与匹配,能够为大模型提供最真实、最及时的反馈。此外智能云、Apollo自动驾驶、小度智能设备等应用也将与文心一言整合。
    3月16日,百度版ChatGPT“文心一言”如期发布,CEO李彦宏演示了文心一言的五个集中场景:文学创作、商业文案创作、数理推算、中文理解和多模态生成。
    文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,这让百度在中文语言的处理上,能够处于独一无二的位置。
    扎根中文土壤,文心一言在中文语言和中国文化上有相对更好的表现。在发布会展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。
    
    争夺这波AI潮入场券的当然不止百度。
    腾讯称,在ChatGPT和AIGC相关方向已有布局,阿里达摩院正在研发的类ChatGPT的对话机器人,目前已开放给公司内员工测试。快手、京东、360等多家互联网企业也都表示在相关领域研发和布局。
    美团联合创始人王慧文在今年2月发布了一条“AI英雄榜”,高调地招兵买马。他设立了光年之外科技有限公司,自己出资5千万美元,估值2亿美元,并表示:“我当前不懂AI技术,正努力学习,所以个人肉身不占股份,资金占股25%。”
    同时,王慧文与语音搜索应用“出门问问”创始人李志飞、真格基金两位合伙人戴雨森和刘元吃饭的照片流出。李志飞也曾公开表示决心要“做一个中国的语言大模型”。
    大厂们疯狂卷进度的比拼,王慧文求贤若渴的姿态,体现出这波AIGC热潮的窗口期之短——一旦没有及时聚集足够的资金和人才,拿出像样的模型或产品,就会被赶下牌桌。
    但在催命般的产业倒计时中,有些事却急不来。
    ChatGPT的出现,数据、算力和算法是关键的三个要素,需要不断的量的积累,才有望一朝获得质变。而我国目前在这三方面仍有较大差距。
    数据方面,中文互联网产生的数据大量储存在移动端APP中,由于互联网巨头之间数据相互封闭,数据抓取难度高,数据孤岛化情况严重。数据的质量和数量不足,就无法提供大量模型训练所需的信息。
    算力方面,由于英伟达A100芯片被美国列入限制出售范围,中国企业只能使用为数不多的A100存货和阉割版的A800,高性能芯片严重缺乏。
    算法方面,好的算法能够使AI具有更强的通用性,并优化计算过程,减少算力负担。我国在AI算法研究、高端算法人才以及具备自研算法实力的科技公司数量等方面仍落后于美国。
    时间壁垒已经产生,在实力鸿沟面前,要做出对标ChatGPT的模型和产品,只有勇气和资金是远远不够的,中国的参赛者们必须拿出更强的创新意识和更深的产业远见。
    一味跟着OpenAI的步伐只会掉入陷阱,更为中国式的打法,应该考虑产业巨头的合纵连横、另辟蹊径的技术路线以及潜在的商业模式,走不同的路才有希望正面应战。
    新一轮的科技革命已经开启,AIGC时代将深刻改变每一个行业的发展模式,而中国AI大厂们在这场技术巅峰赛中也将迎来终局之战。孰胜孰败,我们拭目以待。