用AI发愿，垂直行业厂商逐梦“大模型圈”

2024.09.25 正见TrueView

    “
    一场垂直厂商和在互联网及两次AI浪潮期间崛起的明星企业间的，新的马拉松赛跑。
    内容：koorvoa = 编辑：TV.  校对：莽夫
    “十倍于移动互联网的平台革命”，不仅吸引着国内众多科技大厂投身AI新浪潮，或自研通用大模型，或推出相关产品和解决方案，向企业服务、金融、工业等行业加速渗透，同时也引发细分领域的诸多垂直厂商积极占位，深耕领域内的“一亩三分地”。
    某种程度上而言，大模型是垂直厂商们“不得不为之”的“跟风”选择，即便在资金、技术、人才等硬件条件上与科技大厂相比不具优势，但面对新兴技术浪潮的冲击，不进则退，且极容易被新进入者颠覆。
    这个新进入者，既包括新兴的大模型创业公司，也指向“借机”扎根产业深处的科技巨头。
    Part.1
    以小博大，在夹缝中找机会
    继百度、阿里、华为等第一梯度玩家陆续发布大模型相关产品、方案，腾讯云也于近日正式公布行业大模型技术方案，加之今日发布大模型服务平台“火山方舟”的火山引擎，国内“头号玩家”们的大模型技术方案和商业路径终于全部“浮”于台面之上。

    “基本可以判断，所有行业都值得用大模型重做一遍。当然重做的方式可能有很大的差异，有些行业只需要用通用大模型做finetune或者对齐，但有些行业可能需要从头开始训练，有些行业甚至连模型结构都要换掉。”毫末智行数据智能科学家贺翔对大模型的商业前景判断，与当前市场上的主流声音一致，认为大模型正成为人工智能浪潮的重要拐点。
    尽管大模型是片蓝海，蕴藏着“万亿级商业价值”，但“百模大战”、“千模竞帆”并非戏言，产业侧则是更具确定性的商业标的，竞争激烈程度不言而喻。
    百度、阿里、腾讯等具有技术积累、团队优势和资金支持的科技大厂率先抢跑，并加速应用落地，开启新一轮行业客户之争。
    百度曾宣称与超过300家企业成为生态伙伴；4月阿里云也宣布与七家企业推动大模型在油气、电力、交通等行业落地；华为早前就已发布盘古金融、电力、药物分子三个垂直领域大模型；而刚刚公布MaaS解决方案的腾讯已和数十个行业的22家企业达成大模型共建合作；火山引擎则透露抖音集团内部已有十多个业务团队试用“火山方舟”，首批邀测企业包括金融、汽车、消费等众多行业客户。
    而刚刚发布私域大模型的传统ICT厂商新华三、将于7月发布大模型的京东等等，都关注大模型与产业融合，直接瞄准垂直赛道。
    大厂综合实力更强，一旦模型与场景“飞轮”转起来，更快的掌握优质数据并搭建起服务生态，垂直行业厂商们想再要追赶只会难上加难。
    但并非没有一搏的资本。综合了专家经验、组织能力、工程能力的产业knowhow，是业界普遍认为垂直行业厂商构建大模型的资源壁垒与护城河。长期根植于一线客户，深入的需求理解和丰富的落地场景优势，也是垂直行业厂商可贵的“筹码”。

    Part.2
    押注专业化，行业数据大比拼
    “大模型这个赛道还是太早期了，如果说GPT-4和Bard、LLaMA、Claude（编者注：分别是谷歌、Meta、OpenAI前员工创立的Anthropic发布的大模型）等国外不同技术栈的大模型还存在比拼的话，那么国内的大模型还没有进入赛场（过于早期，没有商用，无法比较），所以目前不存在国内通用大模型之间的比拼。而在作为基石的国内通用大模型还没有真正进入赛场的情况下，垂直大模型也不存在太多的可比性，一切都还在早期。”伙伴云董事长兼 CEO戴志康对正见TrueView表示。
    他进一步举例补充，“某个用于Text2SQL（编者注：将自然语言文本Text转换成结构化查询语言SQL的过程）的垂直模型，可能还比不上LLaMA通用开源模型的Text2SQL能力。”
    目前大模型开展虽轰烈，却还处于初级阶段。百度、阿里等较早公布大模型技术路径和架构全景的头部公司，产品也均未进入公测，属于垂直行业厂商的时间窗口尚未关闭。
    “垂类行业只要紧跟潮流，精准解决用户需求，不会脱离AI大模型。”某股权投资机构副总裁史松坡向正见TrueView分析了垂直行业厂商在大模型时代的机会点，“大模型的落地和应用离不开掌握着流量和用户的垂类厂商，它们需要解决的是如何紧跟大模型，并利用相关技术解决尚未满足的行业客户需求。”
    加快大模型项目共创，由单点测试扩散至规模化商用，积累垂直领域数据和业务know-how，进而优化大模型训练和调优能力，挖掘和解决行业客户尚未被顾及，或被充分改造的痛点，将数字化延伸至产业的“神经末梢”处，这也许是当前窗口期内垂直行业厂商们的机会所在。
    当前越是传统的行业，对大模型产品和解决方案越是有针对性、专业性和精准度的高要求。专业的训练数据和行业知识库是领域大模型的难点，也是垂直行业厂商的优势。
    “假定大家训练和调优能力都差不多，那么谁有最大量、最高质量的垂直领域数据集，谁就拥有了产出更优质垂直模型的能力。即便现在训练和调优能力稍弱，但长期来讲技术能力是能够被追平的，而数据集的鸿沟则不一定能被追平。”在戴志康看来，“真正影响垂直厂商的差距点只有一个，即用于训练垂直模型的数据集。”
    贺翔同样认为垂直与通用大模型“隔行如隔山”。“在纯语言相关的垂直领域，可能存在垂直大模型与通用大模型的竞争。但是在自动驾驶这种独特的垂直领域，不管是语料、任务、还是测评标准，都与通用大模型完全不一致，只能够用自动驾驶大模型来解决。”
    Part.3
    新的马拉松赛跑，在尝试中找出路
    目前大模型技术和产品密集发布，却尚未有成熟案例和成功路径借鉴，垂直厂商们只能摸着石头过河，是MaaS（Model-as-a-Service，模型即服务），还是“完全没有必要去卷大模型，而是应该投身到应用层创新”，标准答案尚未生成。
    火山引擎总裁谭待判断，“企业使用大模型，未来可能会呈现“1+N”的模式：“1”是通过自研或深度合作，形成1个主力模型；由于成本和场景复杂多元等原因，在这个主力模型之外，还会有N个模型同时应用。”
    “企业所需的并非仅仅是一个大模型，而是多个大模型。”竹间智能创始人兼CEO简仁贤持相同观点，“坦率来说，目前绝大多数的生成式AI都是基于谷歌开发的Transformer开发出来的模型”，他认为大模型是不是自研已经不重要了，“真正重要的是，最后用大模型驱动做出的产品是否有实际应用价值。”竹间智能提供的是MaaS服务模式，并设定目标要让企业在99万的预算内即可打造一个企业自有的大模型。
    “中国不太注重生态，一般都是把别人全‘灭’了、全‘杀’了，其实自己也没有发展起来。”自研大模型的Pre-A+轮企业澜舟科技创始人兼CEO周明号召行业厂商应该有一种平和的心态，“To B存在很多新的创业机会，包括对客户、行业的理解，客户与大模型团队的互动，形成某种意义上的战略合作伙伴，或者形成所谓数据飞轮、功能飞轮，做得越深，相应的壁垒就越高。任何一个公司进入到该领域，包括巨头公司，都要花同样的功夫进行积累。”
    虽路径不一，垂直行业厂商却目标一致。皆是用好大模型这一新的生产力工具，升级原有的生产方式，建立新的生产关系。而这也将是垂直厂商和在互联网及两次AI浪潮期间崛起的明星企业间，一场新的马拉松赛跑。
    “垂直模型的底座仍然是通用模型，最终决定市场格局的，是底座通用模型的能力和上层垂直模型的优化。而现在通用模型的发展日新月异，所以垂直模型也面临刚发布不久就需要升级底座的情况。”戴志康解释说，“基于ChatGLM-6B研发的垂直模型，即便当下效果不错，但当三个月后ChatGLM-6B被xxx-6B超越，垂直模型也面临重新洗牌的局面。”他直言，“如果认为现在凭借垂直模型就能构成拐点，可能只是一种市场营销手段。”
    在长期竞争中，没有稳固不变和一蹴而就的市场格局。这场新的马拉松赛跑，匆忙开局，终点未知。