AI大模型在退烧，但巨头已经卷疯了

2024.10.02 Chaos新观察

        Chaos新观察 No.17
    大模型不是万能解药。
    文 | 曹乙
    报道 | Chaos新观察
    ID | GoChaos
    封面来源 | Unsplash
    “不管什么赛道，只要大厂一做，你就知道要开始卷了”——这句行业内的戏言如今正在大模型身上应验。
    自今年3月ChatGPT爆火之后，国内起了一股“备战”大模型之风，各大厂纷纷重金押注：all in AI多年的百度推出“文心一言”誓与ChatGPT一战，华为“盘古”席卷行业，阿里“通义千问”落地办公领域……大模型的火热程度，似乎为唱衰许久“大厂流量见顶”的阴霾照进了一丝光明。
    与此同时，全球大模型独角兽企业“疯狂吸金”，短短半年内，由前OpenAI领导人创立的人工智能企业Anthropic就连获三轮大额融资，总额超8.5亿美元。这进一步刺激了国内大模型创业，截至今年5月，中国公开发布的AI大模型数量就已近百个，单独统计带有 AIGC 标签的公司，2023 年上半年融资交易 58.9 亿元，事件数量 42 起，均远超往年。

    但进入下半年，行业开始逐渐降温。盈利点不清晰，许多创业项目还停留在概念验证阶段，初创企业融资越来越难：一部分投资人举棋不定，一部分投资人干脆放弃看大模型项目，转向芯片。
    马太效应正在加剧，创业公司突围艰难。对于初创企业来说，“落地”成了重中之中。谁能推出重磅应用，或能率先杀出重围。

    大厂的“必争之地”
    大模型到底是一种什么技术？
    大模型，即大语言模型，是指使用大量文本数据训练的深度学习模型，可以生成自然语言文本或理解语言文本的含义。简单来说，大模型能够模拟人类学习语言的过程，以类似人类的方式理解和生成文本，是通向人工智能的重要途径。
    在ChatGPT爆火之前，人们对于AI的现实印象还停留在Siri和天猫精灵，那时人们戏称其为“人工智障”，意在吐槽这一时期的AI“不够智能”。谁也没有想到短短几年时间，AI就从“听懂指令”进化到“执行指令”，甚至能够基于指令自我学习，创作文案、脚本、绘图。
    2016年，AlphaGo战胜世界围棋冠军李世石，曾引发人们对AI发展的短暂恐慌。但很快，消费互联网的爆发占据了人们的注意力，AlphaGo等机器人被认为只能用于像下棋这样的益智游戏；7年后，在经历了消费降级、人口红利消失等危机后，ChatGPT的横空出世，让人们嗅到了一丝来自未来的挑战。有的大厂积极调转车头押注AI，有的大厂则是默默耕耘，一朝闻名。
    打响第一枪的是百度“文心一言”——这是百度在2021年12月推出的百度·文心（ERNIE 3.0 Titan）迭代而来的细分模型，百度创始人李彦宏称将用其重构百度所有的应用。6年前，百度开启“all in AI”战略转型人工智能，现在看来是一个十分具有前瞻性的战略。

    百度文心一言发布会
    作为国内首屈一指的搜索应用，百度拥有庞大而丰富的中文语料库，天然具有研发AI大模型所需要的深度学习基因：2019年百度与国外同期搭建了学习型的文心大模型，而后2022年上线了基于文心大模型的AI绘图文心一格，2023年3月推出生成式AI产品文心一言......这也难怪产品一经发布，就被网友们用于和ChatGPT比较。
    随后，4月11日，阿里云推出通义千问大语言模型，迎战文心一言。阿里董事会主席兼CEO张勇宣布，阿里所有产品将接入大模型全面升级。
    阿里云的强大算力和巨量数据正是研发大模型优势所在，而通义千问也不负众望地实现了众多功能：多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能，融入了多模态的知识理解，能够续写小说，编写邮件等。日前通义千问已尝试向办公领域落地，接入办公软件钉钉，开始帮打工人“搬砖”——做ppt、表格、设计海报、撰写文案。
    紧接着，4月24日，科大讯飞星火认知大模型官网正式上线。作为AI语音龙头，讯飞星火认知大模型围绕“知识问答、代码编程、数理推算、创意联想、语言翻译”等场景布局，并尝试与教育垂直场景的深度融合。
    同样在探索垂直场景的，还有京东在7月13日发布的灵犀大模型：与京东赋能产业的核心战略相同，灵犀大模型融合了70%通用数据与30%数智供应链原生数据，深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景，解决真实产业问题。
    与以上几家正在探索落地的大厂不同，华为的盘古大模型似乎已经找到了“落点”：7月18日，华为联合山东能源集团举行发布会，宣布华为盘古大模型在矿山领域实现首次商用，为大模型的落地应用提供了良好的范本。实际上，盘古大模型就启动研发，华为云CEO张平安表示，希望用盘古大模型帮助各行各业，例如金融、政务、矿山、气象等行业，利用盘古大模型在产品研发、生产供应链、市场营销以及数字运作领域为其赋能——这与华为的B端策略一脉相承。
    在这场“百模大战”中，字节和腾讯两家巨头却显得尤为低调。字节系的火山引擎6月28日发布大模型服务平台“火山方舟”，面向企业提供模型精调、评测、推理等全方位的平台服务，集成多个大模型，供客户直接对比——大搭戏台，聚众所长，正是字节风格；而腾讯的混元大模型，于8月3号宣布进入内测阶段，主要应用于腾讯广告、3D虚拟场景自动生成、对话式智能助手等。

    从消费互联网时代脱颖而出的美团则选择“烧钱”模式——前有狂砸20.65亿元收购大模型创业公司光年之外，后又花费数亿投资智谱AI，比起自研大模型耗费的大量人力、物力、算力和高要求的技术基础，和创业公司合作，既可以节省时间和精力，又避免与巨头正面竞争。
    不难发现，大模型的研发具有共性：即，背后需要“巨量数据、巨量算法、巨量算力”支撑，同时还需要“巨量”人力、时间、财力的投入——这与消费互联网时代“服务器+程序员队伍+产品经理”搭起一个应用不同，打造一个大模型对任何企业而言都不是一件容易的事情。可以预见，未来大模型基本会成为大平台和科技公司的专属领地。
    那么，耗费了巨额成本的大模型，能够肩负起大厂“第二增长曲线”重任吗？

    大模型有了，应用在哪里？
    接下来要回答第二个问题，大模型究竟有什么用？
    炙手可热的同时，大模型也备受质疑：今年3月，超过千名产业界和学术界的大佬们发布联名公告：呼吁全球所有实验室暂停比更强的AI模型研发，暂停时间至少为6个月。在此期间，人工智能领域的专家和行业参与者应该共同制定一套安全协议，并对技术发展进行严格的审查和监督。其中就包括了特斯拉 CEO 埃隆·马斯克、以及苹果联合创始人Steve Wozniak。
    而人们在尝试过ChatGPT之后也发现，它所创作或呈现出来的答案并不理想，尤其是对中文语言的识别差强人意。6月份，ChatGPT网站在全球的桌面和移动端流量比5月减少9.7%，独立访客减少5.7%。
    与此同时，使用AI所产生的伦理问题也被警惕起来。日前，黑莓公司（BlackBerry）发布了一项最新研究称，目前全球有75%的组织，正考虑禁止在工作场所使用ChatGPT和其他生成式 AI 应用；61%正在部署或考虑ChatGPT禁令的公司表示，禁用ChatGPT的措施将是长期或永久性的。而其中被谈论得最多的依旧是AI数据泄漏和隐私安全问题。
    在国内，利用生成式AI诈骗的案例也层出不穷。曾有新闻爆出有受害者被AI诈骗430万，AI换脸、AI拟声的引起的侵权问题更是如雨后春笋。前段时间朋友圈刷屏的“妙鸭相机”也因为隐私霸王条款和不支持退款的问题被上海市消协点名批评。
    回到一开始的问题，大模型究竟有什么用？
    如果说C端使用者对AI的需求仍停留在消费互联网时代的社交、对话、聊天，那么B端才是大模型落地、“变现”的关键支点。毕竟，“百模大战”耗费的巨大成本无法支撑C端“注意力经济”的玩法，只有走入垂直产业应用，才能真正让AI服务人类。
    目前国内行业大模型发展模式主要有两种，一种是“自有通用大模型+外部行业数据”，另一种是“自有或其他开源大模型+自有行业数据”。
    “自有通用大模型+外部行业数据”主要是自有通用大模型的企业以“1+N”模式拓展多个行业大模型，比如百度基于“文心”拓展了金融、医疗、传媒等行业大模型，又如华为基于盘古大模型拓展了矿山领域。这种模式的优势在于，可以利用通用大模型的强大语言能力，快速适应不同行业的需求，同时也可以借助外部数据源，增强行业相关性和准确性。
    “自有或其他开源大模型+自有行业数据”一般是由行业公司结合自身领域数据训练，比如一站式AI视频技术服务商百家云，基于自身视频SaaS/PaaS业务和产品数据，推出业内首款适用于企业市场部内容生产场景的GPT大模型引擎“市场易”，通过文案生成、内容发布、传播分析、舆情监测、知识库、体验中心六大功能板块，重构企业市场营销及推广工作机制。这种模式的优势在于充分利用自有数据的质量和数量级，打造出更专业、更精准的行业大模型，同时也可以借鉴其他开源大模型的技术和经验，提升训练效率和效果。
    业内人士分析，相对而言，垂类大模型在细分领域在解决数据安全隐患、缺乏行业深度等问题方面更具优势。以AI制药行业对大模型的需求为例，由于药物研发对高精度实验数据的获取成本较高，且公开数据库中有大量无标注数据，因此大模型在模型建构上的要求会更高。既要利用好大量无标注数据，又要利用好少量高精度数据，这样的需要对于通用大模型而言无疑是一种“灾难”。
    通用大模型研发所需要的高额成本令不少企业“望洋兴叹”，而垂类大模型则有机会填补这一空白：当前需要探索的不仅仅是让大模型如何“海纳百川”、如何“更加聪明”，更应该考量如何降低垂类大模型在训练时间、调试成本、部署成本方面的成本，让大模型赋能百行千业、走进千家万户。
    关于通用还是行业大模型路径更好，有业内人士指出，当下被鼓吹的行业大模型始终存在着被替代的风险。有业内人士表示，10年前，在语音识别技术上，也曾诞生过诸多聚焦在通话、行车、办公等不同场景的专用模型，但随着通用模型技术的成熟，专用模型也随之退场。从更长远角度看，通用大模型才真正代表着一个平台级或颠覆性的大机会。
    在场景落地方面，据不完全统计，至2023年5月，Bloomberg资讯中共有58个AI应用落地案例，主要集中在传媒、游戏、机器人、办公、医药等领域。例如Discord、Snap、BuzzFeed等厂商通过OpenAI开发自身AI产品，Meta公司5月发布的AI Sandbox大模型，可以为广告生成不同的文字，以迎合不同消费者的需求，目前国内企业也推出了应用。
    说到底，各企业的大模型产品各有侧重、内核相似，但各家的竞争力如何？这取决于客户。

    创业公司能追上大厂吗？
    用户在选择大模型产品时，会重点考察哪些方面？
    主要从云、基础设施、服务等角度来看。
    大模型离不开云厂商。国内迭代最快的大模型公司，如百度、阿里都有自己的云业务。
    大模型创业的生态分为四层——芯片层、框架层、模型层、应用层。其中芯片层+框架层是基础设施，企业的进入门槛最高；模型层对算力、算法、数据、人才的要求非常高；应用层是基于前两类大模型，调用API开发应用。所有的玩家都要在这四大层级里站位，纵向覆盖的层级越多，竞争壁垒越深厚。
    企业客户在选择大模型时，不能只看中技术实力，是否懂行，能否保证交付，运维有没有长期保障，同等重要。

    大模型框架图
    创业公司与大厂的竞争主要来自数据、算法、算力几个维度。
    有业内人士认为，OpenAI并没有在“科学”层面领先大家太多。模型效果更好的原因恐怕还是来源于“工艺”，追随者能够赶上的希望很大，毕竟数字世界的迭代速度远超现实物理世界。
    关键竞争点是数据质量和工程化能力，算法则可以逐步追平，创业公司或可以靠这些核心能力与大厂一战。
    8月3日，阿里大模型通义千问Qwen-7B日前宣布正式开源，阿里云成为中国首个宣布大模型开源的大型互联网科技公司。
    对于正在探索大模型的中小企业和初创企业来说，Qwen-7B的出现无疑降低了他们的技术和应用门槛——开源大模型可以简化模型训练和部署的过程，让用户不必从头训练模型，只需下载预训练好的模型并进行微调，就能快速构建高质量的模型。初创公司有望通过深耕细分领域拿到关键分。
    但围绕算力的抢夺、成本的持续增高，会成为各家企业的共同痛点。
    国内云计算相关专家认为，做好AI大模型的算力最低门槛是1万枚英伟达A100芯片。TrendForce研究则显示，以A100的算力为基础，GPT-3.5大模型需要高达2万枚GPU，未来商业化后可能需要超过3万枚。
    A100愈发抢手，市面的价格开始水涨船高，从官方的1万美元一枚，约合人民币7万，涨到8、9万，甚至10万一枚。代理商透露，英伟达A100芯片价格从去年12月开始上涨，5个月累计涨幅达到37.5％。
    有媒体报道，国内云厂商主要采用的是英伟达的中低端性能产品，拥有超过1万枚GPU的企业不超过5家，其中，拥有1万枚英伟达A100芯片的最多只有一家。
    OpenAl则指出，AI大模型要持续取得突破，所需要消耗的计算资源每3一4个月就要翻一倍。业内指出，OpenAI每一次的训练成本高达6000万美元，每隔三四个月就需要训练一次，迭代一次则需要四五次训练。以此计算，每迭代一次技术基座可能需要2亿到3亿美元。
    作为大模型的主要入局者，国内互联网大厂拥有天然的数据优势，在算力资源上早有布局，业内人士表示，自2022年9月，美国禁止向国内客户售卖英伟达A100、H100和AMD的MI250人工智能芯片后，国内大厂就开始大举囤芯片。
    在高额消耗面前，大厂的资金资源优势凸显，对于初创企业来说，只有推出“杀手锏”应用才能在这轮AI竞赛中获得下一轮的入场券。对于大厂来说，早切入应用场景，也能早回血。

    百家云发布的适用于企业市场部内容生产场景的大模型引擎「市场易」，就瞄准了企业市场宣传和舆情监测需求，做到“易写、易管、易看、易听”，并能精准捕捉竞品来自各种渠道的舆情信息和竞品营销方向信息，并对内容的传播进行量化评估，为企业制定战略提供有力支持。8月底，百家云宣布，基于公司多年服务线上化场景的经验，将在现有技术积淀上，进一步帮助企业客户构建场景化AIGC应用，打造面向大模型垂直应用场景的一站式AIGC 场景化赋能中台“百问大模型”。据介绍，百问支持私有化部署，可在企业内部完整、独立使用，服务更稳定。
    业内人士表示，目前市场中的大模型产品大多是围绕大语言模型。但是未来，大模型一定会走向多模态，形成具备图像、视频、语音、语义综合感知能力的智能体。例如，AI大模型能接入机器人，提升机器人的语言能力、视觉能力、运动控制能力，还有虚拟仿真能力。
    Meta公司在今年7月发布了开源可商用大模型LLaMA2，包含了70亿、130亿和700亿参数3个版本。人们越来越发现，比之大模型本身，它背后日渐发展并快速迭代的生态更有价值。随着大模型开源，未来，会有更多行业、更多企业加入这场浪潮，金融、医疗、传媒、互联网等知识密集型行业的一些固有工作模式或将被改变，届时，互联网世界将迎来一次大变革。
    与这些积极的声音不同的是，一些学者认为，大型语言模型善于从数据中识别和提取因果关系，但缺乏自己主动推理新的因果场景的能力。它们具备通过观察进行因果归纳的能力，但不具备因果演绎的能力。
    AI 可能无法真正“学习”，而只能提炼信息或经验。AI 不是形成一个全面的世界模型，而是创建了一个概要。从这一点看，大模型可能并不是最终解。
    如果我们想让AI能够真正通向“智能”，而不是作为一个“信息集成器”，并且像AlphaGo那样昙花一现的话，那么在积极探索商业落地场景的同时，不妨也想一想，我们真正需要AI做什么。

    *参考资料：
    1.《大厂的大模型之战：八仙过海，各显神通》，独角兽挖掘机
    2.《ChatGPT，将遭全球 75%的企业“封杀”？》，CSDN
    3.《国产大模型已无公司可投》，量子位
    4.《国内外大模型产业如何发展？》，通信世界
    5.《通用大模型创业潮，首战即将终结》，36氪
    *免责声明：
    1、本文内容为Chaos新观察原创，内容及观点仅供参考，不构成任何投资建议；文中所引用信息均来自市场公开资料，我司对所引信息的准确性和完整性不作任何保证。
    2、本文未经许可，不得翻版、复制、刊登、发表或引用。如需转载，请联系我们。