大模型狂飙一整年后，2024年应关注哪些关键点？

2024.04.05 雷科技

做大模型的企业那么多，能实现产业化的凤毛麟角。
    2023年接近尾声，AI大模型的热度丝毫不减。
    谷歌刚宣布为开发人员提供新版Gemini大模型并承诺降低使用成本，微软就推出了拥有27亿参数的全新语言模型Phi-2。在头部巨头动作频频时，腰部玩家开始抱团，比如百奥几何与智谱AI开始共建自然语言-生命语言多模态大模型。
    虽然百度等巨头早在2019年前后就已布局大模型技术，但2023年确实算得上是“大模型元年”，几乎所有头部科技大厂都深度参与研发，热钱不断涌入，将“千模大战”推向新的高潮。然而，在大模型“军备竞赛”之余，业内出现了越来越多的冷思考：基础大模型越来越多，能实现产业化落地为何寥寥无几？2024年，AI技术产品化、产业化以及商业化，将是大模型发展的重中之重。

    （图片来自UNsplash）
    “千模大战”高潮迭起，产业化成头号难题
    从参与企业规模、大模型数量与市场规模来看，中国已是仅次于美国的全球第二大大模型产业中心。
    作为国产大模型的“扛旗者”，李彦宏在上个月的西丽湖论坛上提及一组数据：截止今年10月国内发布的大模型多达238个，较6月翻了整整三倍，Hugging Face平台上可供下载的文本生成大模型则接近3万个。按比例划分，美、中两国已上线/在研大模型数量占到全球的80%以上，吊打其他国家或地区。
    据速途网测算，2023年中国大模型市场规模约为147亿元，同比翻了一倍，预计在2028年将突破千亿大关。庞大的市场规模，巨头的高度重视，诱惑着资本不断加大投入；AI对提升生产效率与经济质量有着重要意义，一定程度关系到国家核心竞争力，因此也得到了有关部门高度重视。可以说，大模型狂飙一整年，离不开政策的支持、巨头的重视和资本的热情。
    在大模型技术有序发展上我国走在世界前列，网信办等七部委联合发布的《生成式人工智能服务管理暂行办法》、北京科委发布的《北京市促进通用人工智能创新发展的若干措施（2023-2025）（征求意见稿）》等中央和地方政府扶持措施相继出炉，为大模型的发展扫清障碍，既提供必要资源倾斜，也避免技术无序发展。
    资本方面，百度、阿里、腾讯、字节、科大讯飞、美团、京东、网易等大厂均在布局大模型技术，有实力的初创企业则成了VC们争抢的香馍馍，热钱不断涌入。中国新一代人工智能发展战略研究院的报告显示，截止10月底，国内已有38起大模型投融资事件，现存AI企业已超过2200家。

    （图片来自贝壳财经）
    而在技术层面，文心大模型、阿里通义、讯飞星火、智谱等国产基础大模型在多个榜单上的评测均位居前列，一定程度上已能与GPT PK。
    大模型行业欣欣向荣，但依然存在一些隐忧——比如困扰大部分从业者的产业化落地问题。任何前沿技术都要转化为产品或者说应用才能为人所用，才能发挥价值。AI大模型当前在基础技术迎头直追的同时，更需要深入到产业端的场景中，在企业的生产经营中，或者用户的生活学习中发挥作用。事实上，后者正是中国AI产业一直以来的优势：相较于下棋、画画、作诗而言，中国科技从业者更接地气，善于将技术应用到场景中，让其为产品、应用或者服务所用——哪怕没那么炫酷也不重要。
    三个标杆案例，看大模型产业化落地之路
    大模型产业化的难点很多，比如不同行业数字化程度参差不齐，不同规模、不同领域的企业对AI的应用需求、可承担的成本，有显著差别，这里的成本除了资金等经济成本外，还有应用AI技术改造业务的风险、时间与边际成本。正因为此，当前虽然很多企业都在关注大模型技术，但真正做到用大模型技术来改造业务甚至打造AI原生应用的企业，却少之又少。
    不过浪里淘沙，我们也能看到一些大模型技术和产业结合的标杆案例。
    1、度小满轩辕大模型：国内首个开源金融大模型
    数据驱动的金融业是数字化程度较高的产业，数据库、存储、服务器、自动化、信息安全等等数字化基础设施，均是在金融业率先应用普及。在AI技术普及过程中，金融业很早就在积极探索将AI与客服、风控、授信、营销等场景结合，降本增效的同时，提升客户体验。
    2023年，大模型技术爆发。金融科技先锋平台度小满在5月就率先开源了国内首个千亿级中文金融大模型“轩辕”；9月，“轩辕70B”开源开放可被自由下载和使用。作为金融场景而生的行业大模型，轩辕在智能化能力、功能服务以及信息安全上均有很强的针对性。

    这种针对性体现在多个方面：比如轩辕用来训练的数据集包含大量机构研报、专业名词、行情数据等金融行业资料，赋予了其极强的金融信息理解和处理能力。
    在技术实力上，轩辕大模型不遑多让。其已通过注册会计师考试、银行/证券/保险/基金/期货从业资格、理财规划师、经济师等金融领域权威考试。而在清华大学、上海交大和爱丁堡大学联合发布的C-Eval大语言模型测评榜单和微软亚洲研究院、MBZUAI、上海交大联合推出的CMMLU榜单中，轩辕均取得了国内所有开源模型排名第一的成绩。C-Eval和CMMLU是目前较为权威的两大专业榜单，能够同时夺得第一，对轩辕这样的行业大模型来说绝对算得上好成绩了。
    度小满轩辕大模型正在金融场景深入应用。
    在内部，轩辕大模型已深入赋能度小满营销、客服、风控、办公再到研发等场景，并已初见成效。在代码助手方面，用大模型辅助生成的代码，采纳率能够达到42%，帮助公司整体研发效率提升了20%;在客服领域，大模型推动服务效率提升了25%。在智能办公领域，大模型目前的意图识别准确率已达到97%。
    度小满向来都很重视金融科技能力对外输出。度小满CTO许冬亮透露，轩辕在5月开源时就有上百家金融机构发出试用申请。从企业客户的反馈来看，轩辕大模型的专业能力有口皆碑，2.0版本上下文对话长度增加至8K，对“非利息收入增长趋势”等金融业的深度问题也能给出专业解释。
    2、阿里通义千问大模型，在电商行业贯彻“AI驱动”战略。
    2023年阿里巴巴有许多大的变动，“用户为先、AI驱动”成为新的战略方向。4月11日发布通义千问大模型的时候，时任阿里巴巴集团董事长、阿里云智能集团CEO张勇就表示“所有软件都值得用大模型升级改造，阿里所有产品都会接入通义千问。”
    阿里确实说到做到，作为阿里大本营的电商业务就早已全面AI化。以通义千问大模型为基础，淘天集团推出了一系列面向B、C两端的AI工具。
    面向B端的工具包括官方客服机器人、图片智能生成、营销投放自主监测等，今年双11大促期间商家调用后台AI工具的次数超过15亿次；面向C端则推出AI智能助手淘宝问问，上线两个月受邀试用人数突破500万。B端工具可提高商家经营效率、降低流量成本，C端功能则可显著改善用户体验，在电商行业狂卷价格时形成差异化竞争力。

    大模型与电商场景的结合，阿里走得最快也最远，马云在阿里内网回帖中甚至提到了“AI电商”这一让人耳目一新的概念。
    为了进一步强化大模型技术实力，以及深化AI与业务的融合，近日淘天集团被爆暗中组建新的AI团队，高调高薪招聘AI顶尖人才，抓紧时间训练针对电商产业的专属大模型“图灵”。根据淘天集团此前透露的消息，未来一年会向商家发布更多AI工具，包括AI开店、经营咨询、智能周报等，服务范围涉及商家日常经营的方方面面。在阿里的推动下，大模型和电商产业的结合才刚刚开始。可以预见，2024年，头部电商平台均会加码“大模型电商”。
    3、科大讯飞星火大模型：大模型+教育的标杆玩家。
    科大讯飞的第一标签是语音智能，第二标签就是智能教育科技巨头。在大模型技术出现前，科大讯飞在AI技术上就已耕耘多年，其相当一部分营收就来自智能教育服务，如口语评测、教育硬件等教育智能化服务。
    在大模型技术爆发后，星火大模型和教育行业的结合更是轰轰烈烈。今年5月讯飞星火认知大模型1.0版本发布次日，带飞了A股教育科技板块，除了科大讯飞外，学大教育、行动教育、国新文化全跟着涨停，呈现出“星火燎原”之势。
    从1.0到3.0，讯飞星火大模型一直重点攻克代码能力和多模态能力，并基于技术上的突破开发出更多针对学校、教育企业以及教师和学生群体的功能、应用。比如针对学校管理环节的学生及教师信息管理、离校申请审核功能，为教师量身打造的教学课件制作助手，给学生提供的AI一对一启发式对话功能等。与此同时，讯飞在其翻译笔、录音笔、学习机、办公本等教育硬件上也在深入应用大模型技术，强化产品力，巩固在这一品类上的优势。

    （图片来自讯飞星火官网）
    金融、电商与教育，三个行业的头部玩家，均能在大模型的改造下获得全新增长点，可见大模型产业化并非痴人说梦，而是必然趋势。
    大模型开卷2024：有无产业化秘诀？
    度小满、阿里、科大讯飞们只是开了个好头，大模型产业化程度依然有很大提升空间，特别是历史悠久、数字化程度较低的农业、制造业、物流航运业、能源业等产业，更是亟需拥抱大模型技术提高生产效率，实现从数字化到智能化的跨越。鉴于此，加速AI技术产品化、产业化和商业化将是大模型行业在2024年的头号任务。谁能率先跑通产业化落地路径，谁就可以在“千模大战”中笑到最后。那么，标杆玩家们给大模型产业化带来了什么启示呢？
    第一，不重复发明轮子，有针对性地选择训练参数和设计功能服务。
    基础大模型已经很多了，市面上缺的是能跟抗衡甚至超越GPT的顶尖基础大模型，以及可让千行百业更低成本、更低门槛、更快应用的“产业大模型”。而要做出强大的产业大模型，需要“既懂AI技术又是产业专家”。
    度小满就是一个很好的例子，一边有背靠百度的AI技术底子，另一边有深耕金融科技行业多年积攒下的产业认知、能力、场景、生态等资源。
    据悉，轩辕虽是基于拥有1760亿参数的Bloom大模型训练而成，但也离不开度小满这些年积累的千亿tokens中文预训练数据集，包括银行、保险、基金等行业的基础知识与巨量参数。因为有后者，轩辕大模型才有远超同类竞品和通用大模型的金融信息处理能力，也才可以面向金融业的痛点场景提供针对性的功能服务。
    第二，深入贴合行业需求“定制”大模型功能服务，而不是闭门造车。
    技术类公司容易出现“拿着锤子找钉子”的问题，如果不能贴合真实需求，技术再强大都可能只是自嗨。
    为什么度小满、阿里和科大讯飞可以在大模型产业化上先尝到甜头？因为阿里本身就是电商产业的龙头，度小满从成立之日起一直深度参与国内科技金融行业建设，科大讯飞也深耕智能教育行业十数载，它们对相应行业理解非一般企业所能及。读懂行业运作逻辑和深层次问题，就能洞悉企业、从业者的真正痛点，并给出行之有效的解决方案。
    以度小满为例，基于的理解、生成、逻辑和记忆四个基础能力，轩辕大模型融合金融行业的使用习惯、优化需求，提供了一系列针对性功能。比如个人信贷管理服务，轩辕大模型为银行客户提供客户历史信息管理、用户多层次需求分析功能，给用户提供专业问题自然语言交互问答服务，充分提高双方的处理效率。度小满在服务金融机构和自有客户时洞察了许多需求，才可以做出真正能用、有用、好用的金融大模型产品。
    第三，众人抬柴火焰高，大模型不是独角戏，必须惠及行业参与者。
    中小企业是产业链的主力军，然而因为受限于资金实力与人才资源，往往很难再第一时间应用新技术，特别是门槛很高的新技术。相较于深度学习而言，大模型需要巨量算力、巨量数据和巨量算法，门槛高出了许多，对很多企业来说有些可望不可即。这对头部玩家来说是机遇所在，如果坚持普惠开放路线，既可让大模型技术有“产业化”的落点，也可以在大模型产业化中获取对应价值。
    在度小满和北大光华管理学院联合举办的大模型技术与应用论坛上，度小满CTO许冬亮就发表过类似观点，他认为大模型是中小金融机构突围而出的机会，因为它们可通过应用创新加快数字化、智能化升级进程，继而跨越数字化鸿沟。
    也不难发现，“开放”成了成功落地产业的大模型的最大公约数。度小满的轩辕、阿里的通义千问、科大讯飞的星火走的均是开源开放路线。正如许冬亮所言，将大模型能力开放给金融机构，不仅可以加快技术的推广普及，还能降低使用门槛，是实现技术普惠的必然选择。
    跟区块链等新兴技术的昙花一现不同，大模型的热度不会骤然下降。一方面，大模型技术在2024年将会纵深到更多产业，C端，大模型驱动的爆款现象级应用一定会出现，B端，大模型产业化的案例只会越来越多。另一方面，大模型技术本质是深度学习技术的延续。AI技术已发展10余年，未来几十年都将是科技产业的基础技术。大模型是AI浪潮上最大的一朵浪花，而AI浪潮，将持续澎湃。

来源：雷科技