Meta缺席大模型战局之因:嫌GPU太贵,用CPU跑AI
ChatGPT 引发了科技巨头之间的竞争,纷纷发布生成式 AI 产品。在本次大模型战场中,Meta 缺席了。
很难想象,Meta 此次落后于竞争对手是因为没有应用 GPU。据说Meta 把钱 All In 元宇宙了,现在用的是市面上最普通的 CPU 参加生成式 AI 战局。
CPU 是计算机世界的主力芯片,已经称霸数据中心几十年,但是其在 AI 研发方面表现不佳。而Meta 嫌弃在人工智能工作方面表现出色的 GPU 芯片太贵,使用大量普通的 CPU 来运行 AI 工作负载。
这导致竞争对手在 AI 领域的发展超过了 Meta。他们使用 GPU 芯片并拥有更好的 AI 软件,因此能够更快地开发新的 AI 产品和服务。
Meta 也曾尝试过自研 AI 芯片,但无疾而终。至此,跪着挨打的 Meta 在这场生成式 AI大战中还能站起来吗?
一步差,步步慌
自宣布 All In 元宇宙以来,Meta 便一直为元宇宙先锋军队 Reality Labs 企业提供补贴。根据 Meta 声明,预计到 2030 年市场规模将达到 1.5 万亿美元左右,该企业需要 10 年时间才能实现盈利。
Reality Labs 处于早期阶段,严重亏损
虽然 Meta 核心业务社交媒体广告仍在产生大量正的自由现金流,但它为严重亏损的 Reality Labs 企业提供补贴,Meta 面临着严峻财务困境,自去年 11 月以来一直在进行规模空前的裁员。
老板扎克伯格曾对裁员之举发视频道歉,情绪低落地承认对公司增长的过度乐观导致公司人员过剩。
钱不够便拆了东墙补西墙。元宇宙研发有投资人盯着可不能轻易撤资断资,属实骑虎难下,Meta 便在其他项目上开始了紧衣缩食。
相比谷歌、微软等大厂,Meta 跑 AI 时用的是 CPU。原因说来合理又离谱——适合 AI 处理的 GPU 芯片太贵了,还被控制着80%的市场份额的英伟达掣肘,索性用市面上常见的 CPU 先跑着。
Meta 还曾自研芯片,在内部设计的定制芯片上进行推理。但后来放弃,同年订购了数十亿美元的英伟达 GPU。
但在 2021 年,Meta还是失望地发现,第一,CPU 真的不可以,GPU 在运行不同类型的模型上远比 CPU 芯片更灵活。第二,自研芯片走不通,小扎决定 All In 元宇宙也直接榨干了 Meta 的算力,自研芯片更是加重负荷。
折腾了一圈,元宇宙没新进度,生成式 AI 赛场失局,真是钱没省到,市场份额被其他巨头严重挤压。
小扎的努力
扎克伯格中途多次试图挽回颓势。
2022 年夏末,扎克伯格召集公司高管团队,花了五个小时,分析公司计算能力长达,特别是处理尖端 AI 的能力。
结果让他受挫,根据9月20日的公司备忘录显示,尽管 Meta 对 AI 研究进行了大笔高调的投资,然而主要业务需要的AI友好型硬件和软件系统都非常昂贵,在这些方面公司的进展相当缓慢。扎心的是,缓慢程度已经阻碍了Meta跟上大规模创新的步伐。
公司里也有人看到这一情况的严重性,这个“吹哨人”是基础设施负责人Santosh Janardhan,他曾说:如果要支持人工智能工作,Meta 需要从根本上改变我们的物理基础设施设计、软件系统以及提供稳定平台的方法。
只是这声哨吹了之后,当时没有任何回音。
与此同时,小扎为应对整体业务对 Meta 进行了改组,此次改组使 Meta 的资本支出每季度增加了约 40 亿美元(当前约 276 亿元人民币),导致其暂停或取消了在四个地点建立数据中心的计划。
这些大笔支出,加重了 Meta 严重的财务问题,生成式AI大战又吞噬了大量的算力,Meta 在算力上栽了个实实的大跟头。
ChatGPT诞生后,投资者的兴趣开始飙升。栽疼了、眼红了,小扎不得不开始自救,今年二月小扎官宣了顶级团队押宝生成式AI。目前,Meta 内部已开始计划开发一款新型芯片,类似 GPU,既能训练AI模型,又能进行推理,该项目将于 2025 年左右完成。
但此时,Meta 已经落后于谷歌等同行一大截。隔壁的谷歌早在2015年就开始部署自己定制的GPU——TPU。
不过这场竞赛还要持续很久,我们可以观察一下 Meta 能否后来赶上。