“百模大战”即将迎来一轮应用淘汰赛

2024.09.28 互联网江湖

文：互联网江湖作者：志刚
    这年头，不做大模型就不好意思说自己是科技公司。
    这不，“百模”大战打了几个月之后，又有新玩家入场了，京东、携程都加入了大模型“战场”。
    相比京东、携程发发布大模型布，这两天的大模型发生了一个更重量级的事情：Meta发布新一代AI模型LLama V2，并宣布LLama V2开源，并可直接商用。
    傅盛发朋友圈评论：“这一下不知道多少公司笑醒在深夜，多少公司哭晕在厕所……”

    据传，LLama V2性能超过了GPT-4、Microsoft和Google的AI模型，能够生成语言、代码和图像。最重要的，相比GPT4，LLama V2开源，并且可以直接商用。
    消息一出，不少人都在感慨：一夜之间大模型变天了。
    要说大模型行业变天，恐怕还有点早，但LLama V2开源可商用、再加上国内这么多大模型落地，“百模”大战，恐怕要迎来第一个“淘汰赛”阶段。
    “百模”大战之后，大模型迈进应用驱动阶段
    大模型赛道，做通用模型的都是大公司。
    Open AI背后站在微软，文心一言背后是百度，通义千问背后是阿里，混元大模型背后是腾讯……再加上商汤、讯飞等“本土”玩家，留给后来者的舞台其实并不大。
    而这个不大的舞台，如今却显得有些拥挤。此前一份国产大模型列显示，目前国内的大模型已经有近百家。

    这么多大模型落地，说明AI大模型可能即将进入产品驱动阶段。
    互联网江湖认为，大模型的发展会经过三个阶段。
    第一阶段，模型数据、数据为核心的技术驱动阶段。
    从ChatGPT 到GPT3阶段，大模型是由技术驱动，这时候关键是算法，和数据训练。
    GTP3之后，差距就在于数据量，这不难理解，这好比是一个有着超强学习能力的孩子，在咿呀学语之前，进步不大，一旦掌握了世界的“数据语言”，那么大模型的进展是飞速的。
    而做通用大模型的玩家，需要尽快度过这个阶段，并建立自己的核心优势。

目前来看，百度文心、腾讯混元、阿里通义千问、商汤大模型、以及讯飞火星等，国产主要大模型都走到这一阶段。
    这些大模型，都是大公司做出来的，能走到这个阶段的大模型，要么算法更先进，要么有足够的数据参数和训练量。
    以百度为例，5月份上线的文心大模型3.5，能力已经超出ChatGPT 3.5，虽然官方没有公布具体的数据量级，但大量的数据、算法优化训练是必经之路。
    这个阶段，拼的其实就是硬实力，拼的是数据生态，人才技术和资金投入，创业公司很难真的从底层做起来。
    第二阶段，是产品驱动阶段。
    当国产大模型不断涌现，“百模”大战的格局上演之后，行业其实就已经走到了产品驱动阶段。
    产品驱动阶段，“百模”大战会经历一轮淘汰赛。
    大模型从业者普遍认为，400 亿-500亿参数量级是模型能力“质变”的门槛。换言之，对于资本市场来说，百亿参数量级之前，一些大模型项目很可能会首先遇到“生存问题”。也就是说，对于一些后来者、在遇到生存问题之前，必须要有足够应用落地。
    也因此，产品阶段的大模型，核心在落地场景。
    大模型其实没有什么路线之争，垂直或者通用，与其说是路线之争，倒不如说是落地的场景之争。
    我们认为产品驱动阶段，大模型落地的重点在于，大公司底层做起，打造行业大模型基础设施，在此之上，垂类的创业公司去做应用端的垂直创新。
    其实现在已经有企业走在这条道路上了，比如商汤SenseChat大模型，在不少领域已经开始与品牌合作落地。
    “表面上看通用大模型和垂直大模型代表了两种技术方向，但实际上两者相辅相成，可以并行发展。更强的通用大模型具备更强大的学习能力，可以快速融合不同行业领域的知识，支持垂直大模型的训练和开发。”商汤科技相关人士表示。
    在大模型领域，商汤扎根很深。
    4月份，商汤“日日新SenseNova”大模型体系公布，并迅速落地。在自动驾驶行业，商汤构建了业内首个感知决策一体化的端到端自动驾驶解决方案UniAD，，使车道线的预测准确率提升了30%，预测运动位移的误差降低了近40%，规划误差降低了近30%。
    天眼查APP显示，商汤科技2021年在香港上市，彼时上市募资55亿港元。

    科大讯飞落地也很快。此前科大讯飞曾表示，随着星火认知大模型的不断迭代，其诊后康复管理平台将逐步实现对所有病种、病程的精细化管理等能力。科大讯飞的大模型最大的特点是更C端，有自己的产品矩阵，接入大模型之后，更容易触达C端用户。
    大模型领域，最先产生商业价值不一定是通用的ChatGPT4，反而更可能产生在应用端走得更快的领域。
    实际上，在科技进步的浪潮中，并不是所有的价值都会被先发的企业拿走，技术商业化的价值，往往会被更成熟的企业拿走的更多。
    就像微信不是最先出现的社交应用，但无疑是最成功的。
    第三个阶段，是用户驱动阶段。
    有了场景之后，最重要的是能够获得用户的认可。从过去AI技术的落地来看，由ToB到ToC，是大模型落地的最终路径。所以，首先为大模型买单的一定是B端。
    不过，从底层商业逻辑上，谁是最终的“受益者”，也就会是最终的“买单者”，说到底，大模型应用的最终结果还是要服务用户。长期来看，也最终会走到用户驱动的阶段。
    只不过，与现在大家所熟知的移动应用不同，“大模型应用”的用户驱动会更快更直接，因此，有大量C端用户的公司（百度、阿里、腾讯）的进展速度可能会超出想象。
    大模型应用爆发的黎明，商业化拐点已至？
    虽然大模型很火，但真正躬身下沉的玩家都是大公司，投资市场的交易数量与去年淡季没有什么变化。
    很明显，市场有顾虑。
    比如，现在下场了，将来如何退出？大模型毕竟是个需要长期投入的项目，募资难，想要退出也难。再比如，比较有潜力的大模型项目其实都在大公司手里，这不是说创业公司没有机会，但市场还是在观察。
    “大模型的终局会是什么呢？我认为对于大模型来说，终局会集中在少量的几个大模型”。百度集团副总裁吴甜表示。
    吴甜认为，大模型产业生态可类比芯片代工厂，把大数据、大算力、大算法都封装，建设自动化、数字化、标准化的生产模式。
    一方面，从底层做起来的大模型，成本非常高，需要多年积累。另一方面，应用层面，几个少量大模型，就会有非常广泛的应用生态。换句话来说，其实并不需要那么多大模型来做重复的应用。
    大模型领域，可能也会有一个新的“二八定律”：两成的大模型玩家掌握真正的底层核心技术，而八成的大模型企业都在各个领域创新，去做大模型的应用。
    可以预见的是，Meta的LLama V2大模型开源、放开商业化之后，大模型应用端的创新会迎来一个高潮，而国内大模型产品集中爆发，应用端也会迎来许多的新变化。
    过去的十年，以用户关系为中心，互联网完成了内容消费、服务消费、商品消费的中心化。
    大家看视频到抖音、快手、B站，买东西到淘宝京东拼多多，本地生活到饿了么美团。于是，搜索广告之后，短视频、本地生活、电商，成了互联网技术创造价值的主要方式。
    而大模型，正在用新技术和新交互，重新改变价值的创造方式。
    这种改变分为几个方面：
    一、过去的互联网是分发内容，而大模型则是在分发的过程中创造内容；
    你向大模型发出一个提问，AI不是事先给出答案，而是在实时生成答案，这样的信息交互方式，本身是分发，也是在创造。
    如果应用到广告领域，就可以通过大模型实时生成广告，广告内容、呈现方式触达用户更精准，不再是所谓的“精准投放”而是真正意义上的“一对一”的制作、传播广告。
    在过去，一千读者心中有一千个哈姆雷特，而在未来，一千个用户面前同时展示的，则是一千个不同定制的品牌广告。用户更能接收到品牌关键信息，广告的转化率也就更高。
    在广告领域，已经有相关的尝试，百度基于大模型推出“擎舵"、腾讯推出“混元”，阿里妈妈的AIGB出价模型，都是这个方向上的应用尝试。
    进一步来看，这种“黑镜”式的信息分发、创造，可能会改变整个互联网的内容生产逻辑。
    二、大模型的交互设计，有新的商业化机会；
    大模型的应用，浅层的是强调功能性，深层的是改变成本结构。
    一个基本的判断是，大模型商业化应用首先会改变的一定是广告、营销行业，因为广告行业对用户获取信息的方式变化更敏感。
    因此，在营销、内容创造等行业，一些新的商业机会可能会被发现。
    几乎可以确定的是，在初期的应用阶段，商业化的机会一定与交互有关。
    比如，Copy.AI和Jasper这两个营销创意工具，以GPT-3作为底层接口实现了持续的规模化变现。他们提供了交互界面和插件、API接口，让大模型能更好的去服务某个领域的客户。
    当然，这只是解决最基本的功能性问题，大模型真正的价值在于改变垂直行业的成本结构，比如自动驾驶大模型的商业化价值，就是在于改变了人们的出行成本结构。
    营销只是一个方面，商业化方面，其实还是得看具体细分领域的应用。
    对于不同的领域，大模型会不断的被垂直细分，去满足更小、更细微的场景应用。而这些更细微，更小的场景，可能会有率先商业化的机会。
    比如，文本生成，比如图片生成。能够先让编剧、漫画家的工作变得更容易？能不能把文案从做PPT的日常循环中给解放出来，这些细小的场景，能够率先变现。
    大公司，和创业公司，在应用层差别可能不是很大，应用层是创业机会最多的大模型领域，未来行业内也可能会跑出几家专注于大模型应用的公司。
    互联网江湖认为，新技术应用，找到专有价值链要素，嵌入行业，是一个必经之路。因此在应用上，找场景的公司，比练算法、堆参数的公司更有机会。
    大模型的成功有阶段性质变，就像是GPT3到GPT4，但接下来这种变化会越来越不明显。也就是说，数据训练的边际收益会降低，
    大模型能力的进阶需要数据量做支撑，而商业化则需要考虑成本问题，如何解决这个问题，颇为关键。
    商业化拐点已至，大模型的商业化短期看B端，长期机会可能还是在C端。
    大模型，有点像前几年火的ToB，不仅是要看自身的成熟度，也得看行业端的适配。
    大模型的成本很高，商业化首先就要到合适的场景中，并且能够真正赚到钱，只有真正在AI应用场景中挣到钱，并且能够真正与行业适配，大模型才有商业化的竞争力。
    能够承载大模型商业化的，只有降本需求更迫切的B端。
    事实也的确如此，以商汤为例，在金融领域，商汤与银行、保险、券商等客户展开合作，利用数字人进行智能客服、智慧营销等工作，并通过接入大语言模型能力，提供投研分析、研报撰写等新功能，试图帮助银行金融机构降本增效。
    在医疗领域，商汤中文医疗语言大模型“大医”，也能够提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力。
    进一步来看，B端之外，未来的大模型也可能会承载更多的商品和服务分发。
    移动生态中，触达用户的方式其实就是网页、APP、小程序，那么未来的大模型生态中，如果用大模型来分发内容，那么流量的分发会更加去中心化。
    实际上，一旦语言大模型成熟，并且有了足够多的用户习惯，那么，承载商品与服务分发的APP、小程序，可能就会被大模型取代。
    也就是说，在ToB应用的阶段之后，未来大模型长期的价值和商业化机会，更多其实还是在C端。
    只不过，以当下的视角来看，很难去定义AI应用的“新场景”，这就像是当你身处90年代，你不可能预测到如今的微信、抖音崛起。
    如今的大模型也同样如此。
    结语：
    从公元元年到18世纪，人类经济增长曲线几乎是平的，也只有在近三百年才出现工业革命，近几十年才有了信息技术。
    人类历史上第一台计算ENIAC最初诞生，并不是用于个人计算，而是用于大量军用数据的计算，但数十年后，它却彻底改变了人们的生活方式。
    如今的大模型，就如同当年的ENIAC。
    当泡沫散去，大模型究竟是不是“比互联网更伟大”的机会？或许人们心中早已有了答案。