大模型“以厘计价”，谁能扛住价格战？

2024.10.18 科技云报道

    最近一周，铺天盖地都是大模型降价的消息。字节降完，智谱降；阿里降完，百度降；腾讯降完，科大讯飞降......是不是很像蹲萝卜的游戏？
    事实上，国内有头有脸的大厂几乎都加入了这场游戏。接二连三地降价，让人一瞬间有了当年共享单车和云计算价格战的感觉。
    互联网时代，所有人都习惯于大规模烧钱来获得最后的胜利。但AI时代，这套玩法还行得通吗？

      国产大模型“以厘计价”
    降价在商业世界里并不难理解，无非是“降价促销”、“以价换量”。
    大模型领域的扛把子OpenAI就已经多次降价。
    从去年3月OpenAI发布GPT4到现在，其产品从GPT4升级到GPT-4o，输入价格从0.03美元/千tokens下降到0.005美元/千tokens，降幅为83%；输出价格从0.06美元/千tokens下降到0.015美元/千tokens，降幅为75%。
    但惊人的是，国内大模型比OpenAI更狠，直接把价格“打骨折”。
    5月11日，智谱AI大模型的个人版GLM-3Turbo模型产品的调用价格从0.005元/千tokens降低至0.001元/千tokens，直降80%；GLM-3Turbo Batch 批处理API也便宜了50%，价格仅为0.0005元/千tokens。
    紧接着，5月15日，字节宣布豆包通用模型pro-32k版、pro-128k版在企业市场的推理输入价格仅为0.0008元/千tokens、0.005元/千tokens，较行业降幅达99.3%、95.8%，并声称已经击穿了大模型行业的最底价。
    但“价格屠夫”还在后面。5月21日，阿里云通义千问GPT-4级主力模型Qwen-Long的API输入价格降至0.0005元/千tokens，直降97%。
    各大厂动不动就降价90%以上，已经是硝烟四起，然而还有更狠的角色——百度直接宣布文心Speed和文心Lite两款模型免费，开启了大模型API调用的“免费时代”。
    5月22日，腾讯也按耐不住了，宣布主力模型之一的混元-lite 模型不仅从4k升级到256k，而且全面免费。同日，科大讯飞首推永久免费大模型，讯飞星火API能力向全球用户开放。有网友戏称，大模型正从“以分计价”的定价模式向“以厘计价”的时代迈进。
      价格战提前来临？
    其实大模型降价并不稀奇，但稀奇的是商业化还没跑通，怎么价格战就先来了？
    根据此前预期，大模型大致将按照每年50%-75%幅度降本，但现在大模型的降本速度远超预期。
    答案很简单：加快商业化落地。
    随着大模型参数越来越大，研发成本也越来越高。在巨大的成本压力下，大模型厂商不得不加紧寻找一条商业化之路。
    根据无问芯穹发起人汪玉，用公开数据做了一次针对算力成本数量级的测算，假设GPT-4 Turbo每天要为10亿活跃用户提供服务，每年的算力成本可能超过两千亿，这还不包括模型训练的投入。
    华为大模型负责人田奇曾提到，大模型开发和训练一次需要约1200万美元，这表明即使技术再领先的公司，大模型的训练也是非常昂贵的。
    百川智能创始人CEO王小川也曾表示，每1亿参数对应训练成本在1.5到3万人民币之间。因此，一个千亿级参数的模型单次训练成本预估在3000万至5000万人民币之间。
    显然，高昂的研发价格，已经成了AI商业化的枷锁。绝大部分公司的收入仍然还在亿的级别。以这种成本去打造商业闭环，显然是不成立的，而降价就成了最直接且最快速的落地方式。
    同时，价格战能掀起的另一个因素是，大模型技术已经卷得差不多了。
    外卖、快递、网约车、社区团购乃至新能源车等价格战火热的行业，或多或少都是由于同质化竞争而导致的，大模型也可能是当前卷性能带来的收益越来越低。
    在《LLMs正达到收益递减的证据——及其可能意味着什么》一文中，作者认为大模型在性能提升方面可能已达到收益递减的临界点。以OpenAI为例，从GPT-2到GPT-3、GPT-3到GPT-4都有巨大的飞跃，但GPT-4到GPT-4 Turbo就没有那么多了。
    如果大模型的性能发展真的要迎来一面墙，那么对于大模型公司来说，如何抢下用户是现阶段最重要的一步。
    目前，国内大模型先头部队大多已接近GPT-4的能力，而这一能力已具备商业化的基础。经过一年多的技术比拼，大模型显然已经到了大规模市场验证的阶段。
    因此，2024年大模型开始了从“卷技术”向“卷应用”的转变，商业化、落地应用成为大模型公司的主旋律，而降价将为大模型的应用落地带来了极大推动力。
      谁能扛住价格战？
    虽然大家都在价格上卷起来了，但并不是所有企业都能加入价格战。
    降价涉及到大模型的研发、训练、推理等一系列成本的优化，只有把大模型的研发成本尽可能的降低到最小，才有降价的空间和资本。
    毋庸置疑，大厂是最扛打的一波。
    在这轮价格战里，云厂商是最重要的发起方之一，先有字节的火山引擎，后来百度智能云、阿里云、腾讯云先后加入。
    对云计算公司来说，大模型商业化能不能跑通，并不重要。更重要的是，如何依托于大模型新需求，打破过去云厂商的格局，重新建立自己的领先位置。
    根据媒体报道，阿里云内部已经提出一个非常激进的目标，在三年之内，要占领国内大模型云计算市场的90%。这也是为什么阿里把国内5家大模型独角兽都投了一遍。
    而火山引擎自2020年才对外提供服务开始，一直想以传统云计算模式去追赶大厂，始终没有太大起色。大模型出现改变了这一切。去年以来，它开始将字节跳动的AI能力作为突破口，试图打破旧有格局。这次降价也是这一逻辑下发生的。
    事实上，基于大模型卖云服务并不是大厂唯一的商业模式。基于大模型重构应用，乃至打造大模型时代的超级应用，成为大厂在AI时代的新目标。
    如果能够像互联网和移动互联网时代一样，诞生淘宝、微信这样的超级应用，大厂们又将迎来商业史上新的辉煌。
    目前，百度已经完成了对百度文库、百度搜索、百度地图、如流等业务的AI重构。
    阿里对钉钉、高德地图、闲鱼、饿了么、优酷、盒马、淘票票，天猫、淘宝等阿里集团最核心的产品进行了全面升级。
    字节内部也开启了赛马机制，抖音、剪映等50多个业务线各自为营开始了AI探索。过去一年里，除了主打的豆包App外，基于豆包大模型，还推出了互动娱乐应用“猫箱”，以及星绘、即梦等AI创作工具。
    腾讯则将混元大模型落地在超600个腾讯内部业务和场景中，包括企业微信、腾讯会议、腾讯文档等“一门三杰”产品，也包括腾讯乐享、腾讯电子签、腾讯问卷、腾讯云AI代码助手等协作SaaS产品。
    相比大厂的高举高打，大模型创业公司就显得不那么从容了。
    百川智能创始人王小川表示，百川并不会“掺和”到价格战当中，原因在于，当前To B并不是百川的主要商业模式，价格战对其影响有限，百川更多的精力，还是会放在超级应用当中。
    零一万物的李开复博士认为，目前零一万物带给的性能、性价比都很高了，不打算降低YI系列模型的API价格。“就像特斯拉，他不会因为别的牌子车比他卖得很便宜，他也要来降价。”
    率先掀起价格战，喊着“不做应用做研究”的DeepSeek，也没有在各家大厂密集召开降价发布会时发声，显得无心参战。
    无论创业系公司如何自圆其说，和财大气粗的大厂相比，一不小心都有可能震荡出局。
    更大的挑战在于，国内大厂和大模型厂商基本都走模型+应用路线，推出各自的To C App，不少AI助手也已经开始大规模的市场投放。
    不管是基础大模型的价格战，还是To C应用的用户争夺战，战火都已经烧起来了。
    结语
    无论从哪个角度看，把大模型拉入价格竞争，都不是一个明智的做法，也不一定会让大模型厂商迎来商业闭环。但现实是，这事就这样发生了。
    既然大模型未来的发展谁都看不清，那就先降价把用户拿下来再说。这是移动互联网过去10年被证明过无数次的真理。
    拿到用户，不管商业化能不能跑通，至少融资、并购后面还有的聊。但没有用户，你连上谈判桌的资管都没有。
    在这种情况下，大模型厂商降低开发者成本，让更多开发者参与进来，帮助他们去触碰曾经触碰不到的用户，显然就是一条必经之路。
    【科技云报道原创】
    转载请注明“科技云报道”并附本文链接