通用大模型转向行业大模型
刘旷AI大模型从概念提出到应用落地成效显著,目前逐渐从C端“对话作诗”走向各行各业。
近期,腾讯云公布行业大模型研发进展,其立足不同企业的需求场景,依托腾讯云TI平台打造了行业大模型精选商店,为客户提供MaaS(Model-as-a-Service)一站式服务,助力客户构建专属大模型及智能应用。
无独有偶,在华为开发者大会2023(Cloud)上,华为云盘古大模型3.0正式对外发布,这是一个面向行业的大模型系列,其将围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向,为行业客户、伙伴及开发者提供更好的服务。
腾讯云、华为云等头部云服务厂商领路,各行各业的龙头企业和创业公司跟随,行业大模型一时间热闹起来。不出意外,近几个月行业大模型会迎来一波密集发布的小高潮,大模型产业的垂直化、企业化也将更深入。
(配图来自Canva可画)
转战行业大模型
从市场现状来看,大模型的战争从通用大模型转向行业大模型是大势所趋。
正如腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生所说的:“通用大模型可以在100个场景中,解决70%-80%的问题,但未必能100%满足企业某个场景的需求”,通用大模型在解决特定场景的专业问题时存在一定的局限性。
一来,通用大模型有广泛的适用性但缺乏行业深度,在专业和更加细分的垂直领域几乎提供不了高价值的服务。
众所周知,通用大模型需要三大支柱支撑即算法、数据、算力,其中数据决定智能范围,影响数据分析的精准度和全面性,而通用大模型数据大多来自于公开文献与网络信息,专业行业数据积累不足,在医疗、金融等专业性较强的产业,通用大模型提供的服务价值有限。
二来,使用通用大模型需要上传数据到大模型方提供的服务器,存在数据泄露的风险和安全问题。
普通通用大模型并非本地部署也没有用户权限管控,对数据安全敏感的金融行业、G端客户在运用大模型时很难保证数据的安全,采取有效的控制措施提高通用大模型的安全性和数据保护迫在眉睫。
三来,通用大模型需要处理海量的数据与计算资源对算力、算法要求高,意味着更高的运营成本。据网络公开数据,以GPT-3的AI大模型为例,OpenAI使用了近1万亿个单词和45TB的数据量来训练它,单次训练成本达到140万美元。
相比通用大模型,垂直大模型在控制成本方面有很大优势,因为模型参数少,训练调试、优化和实施的成本更低,这对于追求“降本增效”的中小型企业更加友好。
通用大模型数据安全、算力成本、行业深度等多方面的不足,腾讯云、华为云等云服务厂商积极研发低门槛、低成本、高效率且安全,又适合落地的行业大模型。
腾讯云整合生态资源
在其他云服务厂商还在C端市场火拼的时候,腾讯云早早的瞄准了TOB 场景。
6月19日,针对通用大模型高成本、安全性低等问题,腾讯云推出了MaaS服务全景图,为客户提供一站式模型服务,涵盖完善的模型工具、成熟的流程方法、全面的配套服务以及领先的安全保障能力。
与此同时,腾讯云围绕自身产业生态优势去发展和壮大行业大模型业务,取得了一定的成果和反馈。
据了解,腾讯云行业大模型能力已经在腾讯企点、腾讯会议、腾讯云AI代码助手等多款产品中落地使用。此外,腾讯云联合行业头部企业,已为文旅、政务、金融等 10 余个行业,提供了 50 多个大模型行业解决方案。
不得不说,庞大的产业生态是推动行业大模型落地的重要资源。腾讯投资的业务大而广,而无论是社交、文娱、大健康,还是金融、汽车等产业都需要走向数字化,大模型又是产业数字化发展的标配,在应用行业大模型方面,腾讯云有先天优势。
除了产业生态资源之外,腾讯云发展行业大模型的竞争力还在于技术的积累和创新。
在技术方面,腾讯云背靠腾讯优图实验室、腾讯 AI Lab 等顶级实验室,底层算力、算法开发、AI 应用等技术能力不言而喻,而且腾讯云算力、算法等方面的实力不是一成不变而是一直在进步。
值得一提的有,腾讯云自研的星脉高性能计算网络、向量数据库,能提升40%的GPU利用率,节省30%~60%的模型训练成本,为AI大模型带来10倍通信性能提升,可为行业大模型的应用提供更坚实的算力底座。
据财报透露,腾讯还在自研数据库TDSQL、安全平台EdgeOne和大数据处理套件TBDS之类的技术,以及研究AI开发相关的TI平台等。腾讯2023年第一季度研发投入为151.81亿元,而且自2018年来5年累计超过2200亿元,研发投入只多不少。
在生态方面,腾讯云秉承开放共赢的理念将技术开放给更多合作伙伴,打造可持续创新发展的大模型生态。
对此,腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声表示:“AI大模型技术发展和产业探索,离不开产业链协同和生态共建,腾讯希望与行业伙伴携手,共同推进大模型在产业领域的创新和落地。”
总而言之,腾讯云基于自身生态资源优势、坚实的技术底座还有开放的技术平台,率先在行业大模型领域“落位”,随着技术的进一步精进和应用场景的扩大,腾讯云有望在行业大模型领域保持领先地位。
华为云深耕垂直产业
时间车轮滚滚,自2019年以来华为一直致力于研发和升级迭代盘古大模型,通过不断投入资金、人力和资源,提升了自己在行业大模型领域的技术实力。
2019年-2020年,华为内部投入AI大模型研发,立项做盘古大模型;2021年4月,华为云盘古大模型正式面世;2022年,盘古大模型升级2.0版本,落地行业应用;2023年,盘古大模型 3.0 正式发布,继续深入产业链。
盘古大模型3.0三层架构可以快速调整方向,快速适配客户的多变需求,为不断变化的产业数字化趋势提供可靠的解决方案。华为云这种兼顾通用大模型、行业大模型以及更细化场景大模型服务的能力背后,依仗的是多年来持续的技术研发。
一方面,华为云大模型技术实力强劲,体现在人工智能技术的持续投入和创新能力上。财报数据显示,华为2022年研发投入达到1615亿人民币,占全年收入的25.1%,十年累计投入的研发费用超过9773亿人民币。
这种投入力度和创新速度使得华为云能够在人工智能领域取得突破,为大模型的全面落地奠定了坚实的基础。财报数据显示,2022年华为提交了8440份专利申请,其中90%以上为发明专利,涉及电子通信、光技术、鸿蒙操作系统、计算存储、智能汽车等多个领域。
另一方面,华为云继续深耕政务、铁路、制造、药物等垂直行业的数字化,通过在这些垂直行业中提供安全、可靠、高效的AI大模型解决方案,树立自身良好形象,也彰显盘古大模型的价值。
在煤矿领域,盘古矿山大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,已在全国8个矿井规模使用;在铁路领域,盘古铁路大模型能精准识别现网运行的67种货车、430多种故障,无故障图片筛除率高达95%……
不得不说,华为云盘古大模型3.0高度可定制化的能力,使其可以根据不同行业、企业和用户的需求进行定制,能够满足千行百业各种复杂的场景,这种灵活性和可拓展性让华为云盘古大模型在垂直领域收获“累累战绩”。
关于未来,华为轮值董事长胡厚崑表示,华为在人工智能发展上有两个着力点:“第一,打造强有力的算力底座,支撑中国人工智能产业的发展。第二,从通用大模型到行业大模型,让人工智能服务好千行百业、服务好科研创新。”
这样意味着,华为云要不断深化行业大模型技术研究与生态拓展,加速占领更大的市场份额,而这一过程也会遇到更多的技术挑战和场景竞争。
加速抢占B端“着陆点”
腾讯云、华为云之外,越来越多大厂投入到行业大模型的开发和训练以及商业化中,他们寄希望于采用更精准的行业数据、更低成本解决某些产业核心技术“卡脖子”问题,这也意味着一场行业大模型的“着陆之争”悄然到来。
首先,自动驾驶、医疗、教育、金融等领域的行业大模型层出不穷,一系列行业大模型的集中爆发,将推动行业大型模型的发展和应用,也必然会加剧市场竞争。
3月,网易有道推出国内首个教育场景下类ChatGPT模型“子曰”;4月,毫末智行发布全球首个自动驾驶生成式大模型DriveGPT;5月,我爱我家推出行业首个房产经纪大模型1.0版本;6月,东软面向医疗领域推出添翼医疗领域大模型;7月,中国移动宣布发布九天人工智能行业大模型……
其次,百度云、阿里云、腾讯云、华为云高喊大模型落的口号,并推出相关的行业大模型,在不同的行业、产业中落地已成为头部云服务厂商的新战场。
有人说,AI大模型只有大企业和资金充足的企业才能玩得转,确实如此。AI大模型的研发和训练需要海量的数据、高额的费用、优秀的科技人才,而具备这些条件的企业基本是互联网巨头或行业龙头企业,它们深入到产业中去的发展共识,亦是行业竞争风向标。
最后,国内各行各业的数字化转型需求是多元而丰富的,行业大模型厂商正在探索多种行业大模型落地的可行性。IDC对基于大模型的AI市场规模进行了预测,预计中国人工智能市场规模在2023年将超过147亿美元,到2026年这一规模将超过263亿美元。
综上所述,行业大模型是当下云服务厂商绝对不能错过的风口,腾讯云、华为云已经凭借其产业生态基因和擅长的AI技术,提供差异化的行业大模型服务,行业大模型落地将成为云厂商们的下一个竞争的主场。