通用大模型转向行业大模型

2024.04.13 刘旷

AI大模型从概念提出到应用落地成效显著，目前逐渐从C端“对话作诗”走向各行各业。

近期，腾讯云公布行业大模型研发进展，其立足不同企业的需求场景，依托腾讯云TI平台打造了行业大模型精选商店，为客户提供MaaS（Model-as-a-Service）一站式服务，助力客户构建专属大模型及智能应用。

无独有偶，在华为开发者大会2023（Cloud）上，华为云盘古大模型3.0正式对外发布，这是一个面向行业的大模型系列，其将围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向，为行业客户、伙伴及开发者提供更好的服务。

腾讯云、华为云等头部云服务厂商领路，各行各业的龙头企业和创业公司跟随，行业大模型一时间热闹起来。不出意外，近几个月行业大模型会迎来一波密集发布的小高潮，大模型产业的垂直化、企业化也将更深入。

（配图来自Canva可画）

转战行业大模型

从市场现状来看，大模型的战争从通用大模型转向行业大模型是大势所趋。

正如腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生所说的：“通用大模型可以在100个场景中，解决70%-80%的问题，但未必能100%满足企业某个场景的需求”，通用大模型在解决特定场景的专业问题时存在一定的局限性。

一来，通用大模型有广泛的适用性但缺乏行业深度，在专业和更加细分的垂直领域几乎提供不了高价值的服务。

众所周知，通用大模型需要三大支柱支撑即算法、数据、算力，其中数据决定智能范围，影响数据分析的精准度和全面性，而通用大模型数据大多来自于公开文献与网络信息，专业行业数据积累不足，在医疗、金融等专业性较强的产业，通用大模型提供的服务价值有限。

二来，使用通用大模型需要上传数据到大模型方提供的服务器，存在数据泄露的风险和安全问题。

普通通用大模型并非本地部署也没有用户权限管控，对数据安全敏感的金融行业、G端客户在运用大模型时很难保证数据的安全，采取有效的控制措施提高通用大模型的安全性和数据保护迫在眉睫。

三来，通用大模型需要处理海量的数据与计算资源对算力、算法要求高，意味着更高的运营成本。据网络公开数据，以GPT-3的AI大模型为例，OpenAI使用了近1万亿个单词和45TB的数据量来训练它，单次训练成本达到140万美元。

相比通用大模型，垂直大模型在控制成本方面有很大优势，因为模型参数少，训练调试、优化和实施的成本更低，这对于追求“降本增效”的中小型企业更加友好。

通用大模型数据安全、算力成本、行业深度等多方面的不足，腾讯云、华为云等云服务厂商积极研发低门槛、低成本、高效率且安全，又适合落地的行业大模型。

腾讯云整合生态资源

在其他云服务厂商还在C端市场火拼的时候，腾讯云早早的瞄准了TOB 场景。

6月19日，针对通用大模型高成本、安全性低等问题，腾讯云推出了MaaS服务全景图，为客户提供一站式模型服务，涵盖完善的模型工具、成熟的流程方法、全面的配套服务以及领先的安全保障能力。

与此同时，腾讯云围绕自身产业生态优势去发展和壮大行业大模型业务，取得了一定的成果和反馈。

据了解，腾讯云行业大模型能力已经在腾讯企点、腾讯会议、腾讯云AI代码助手等多款产品中落地使用。此外，腾讯云联合行业头部企业，已为文旅、政务、金融等 10 余个行业，提供了 50 多个大模型行业解决方案。

不得不说，庞大的产业生态是推动行业大模型落地的重要资源。腾讯投资的业务大而广，而无论是社交、文娱、大健康，还是金融、汽车等产业都需要走向数字化，大模型又是产业数字化发展的标配，在应用行业大模型方面，腾讯云有先天优势。

除了产业生态资源之外，腾讯云发展行业大模型的竞争力还在于技术的积累和创新。

在技术方面，腾讯云背靠腾讯优图实验室、腾讯 AI Lab 等顶级实验室，底层算力、算法开发、AI 应用等技术能力不言而喻，而且腾讯云算力、算法等方面的实力不是一成不变而是一直在进步。

值得一提的有，腾讯云自研的星脉高性能计算网络、向量数据库，能提升40%的GPU利用率，节省30%~60%的模型训练成本，为AI大模型带来10倍通信性能提升，可为行业大模型的应用提供更坚实的算力底座。

据财报透露，腾讯还在自研数据库TDSQL、安全平台EdgeOne和大数据处理套件TBDS之类的技术，以及研究AI开发相关的TI平台等。腾讯2023年第一季度研发投入为151.81亿元，而且自2018年来5年累计超过2200亿元，研发投入只多不少。

在生态方面，腾讯云秉承开放共赢的理念将技术开放给更多合作伙伴，打造可持续创新发展的大模型生态。

对此，腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声表示：“AI大模型技术发展和产业探索，离不开产业链协同和生态共建，腾讯希望与行业伙伴携手，共同推进大模型在产业领域的创新和落地。”

总而言之，腾讯云基于自身生态资源优势、坚实的技术底座还有开放的技术平台，率先在行业大模型领域“落位”，随着技术的进一步精进和应用场景的扩大，腾讯云有望在行业大模型领域保持领先地位。

华为云深耕垂直产业

时间车轮滚滚，自2019年以来华为一直致力于研发和升级迭代盘古大模型，通过不断投入资金、人力和资源，提升了自己在行业大模型领域的技术实力。

2019年-2020年，华为内部投入AI大模型研发，立项做盘古大模型；2021年4月，华为云盘古大模型正式面世；2022年，盘古大模型升级2.0版本，落地行业应用；2023年，盘古大模型 3.0 正式发布，继续深入产业链。

盘古大模型3.0三层架构可以快速调整方向，快速适配客户的多变需求，为不断变化的产业数字化趋势提供可靠的解决方案。华为云这种兼顾通用大模型、行业大模型以及更细化场景大模型服务的能力背后，依仗的是多年来持续的技术研发。

一方面，华为云大模型技术实力强劲，体现在人工智能技术的持续投入和创新能力上。财报数据显示，华为2022年研发投入达到1615亿人民币，占全年收入的25.1%，十年累计投入的研发费用超过9773亿人民币。

这种投入力度和创新速度使得华为云能够在人工智能领域取得突破，为大模型的全面落地奠定了坚实的基础。财报数据显示，2022年华为提交了8440份专利申请，其中90%以上为发明专利，涉及电子通信、光技术、鸿蒙操作系统、计算存储、智能汽车等多个领域。

另一方面，华为云继续深耕政务、铁路、制造、药物等垂直行业的数字化，通过在这些垂直行业中提供安全、可靠、高效的AI大模型解决方案，树立自身良好形象，也彰显盘古大模型的价值。

在煤矿领域，盘古矿山大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景，已在全国8个矿井规模使用；在铁路领域，盘古铁路大模型能精准识别现网运行的67种货车、430多种故障，无故障图片筛除率高达95%……

不得不说，华为云盘古大模型3.0高度可定制化的能力，使其可以根据不同行业、企业和用户的需求进行定制，能够满足千行百业各种复杂的场景，这种灵活性和可拓展性让华为云盘古大模型在垂直领域收获“累累战绩”。

关于未来，华为轮值董事长胡厚崑表示，华为在人工智能发展上有两个着力点：“第一，打造强有力的算力底座，支撑中国人工智能产业的发展。第二，从通用大模型到行业大模型，让人工智能服务好千行百业、服务好科研创新。”

这样意味着，华为云要不断深化行业大模型技术研究与生态拓展，加速占领更大的市场份额，而这一过程也会遇到更多的技术挑战和场景竞争。

加速抢占B端“着陆点”

腾讯云、华为云之外，越来越多大厂投入到行业大模型的开发和训练以及商业化中，他们寄希望于采用更精准的行业数据、更低成本解决某些产业核心技术“卡脖子”问题，这也意味着一场行业大模型的“着陆之争”悄然到来。

首先，自动驾驶、医疗、教育、金融等领域的行业大模型层出不穷，一系列行业大模型的集中爆发，将推动行业大型模型的发展和应用，也必然会加剧市场竞争。

3月，网易有道推出国内首个教育场景下类ChatGPT模型“子曰”；4月，毫末智行发布全球首个自动驾驶生成式大模型DriveGPT；5月，我爱我家推出行业首个房产经纪大模型1.0版本；6月，东软面向医疗领域推出添翼医疗领域大模型；7月，中国移动宣布发布九天人工智能行业大模型……

其次，百度云、阿里云、腾讯云、华为云高喊大模型落的口号，并推出相关的行业大模型，在不同的行业、产业中落地已成为头部云服务厂商的新战场。

有人说，AI大模型只有大企业和资金充足的企业才能玩得转，确实如此。AI大模型的研发和训练需要海量的数据、高额的费用、优秀的科技人才，而具备这些条件的企业基本是互联网巨头或行业龙头企业，它们深入到产业中去的发展共识，亦是行业竞争风向标。

最后，国内各行各业的数字化转型需求是多元而丰富的，行业大模型厂商正在探索多种行业大模型落地的可行性。IDC对基于大模型的AI市场规模进行了预测，预计中国人工智能市场规模在2023年将超过147亿美元，到2026年这一规模将超过263亿美元。

综上所述，行业大模型是当下云服务厂商绝对不能错过的风口，腾讯云、华为云已经凭借其产业生态基因和擅长的AI技术，提供差异化的行业大模型服务，行业大模型落地将成为云厂商们的下一个竞争的主场。