8个月过去了，中国大模型落地进展如何？

2024.10.05 产业家

     就目前来看，大模型落地金融、能源行业先行，智能客服等生成类应用大于决策类应用，落地价值不及预期。然而随着行业定制化、模型轻量级化和数据安全化等技术的发展，AI大模型的落地应用将迎来更加广阔的发展空间。
    作者|斗斗
    编辑|皮爷
    出品|产业家
    距离ChatGPT爆发的那一天，已经过去8个月了。
    8个月的时间，中国诸多大模型拔地而起，以飞快的速度，不断向各个行业场景渗透。但就目前为止，并未出现真正被大模型颠覆的场景或行业。
    统计数据显示，在大模型落地应用中，45%的企业处于观望阶段、39%的企业处于探索可研阶段、16%的企业处于试点应用阶段，而全面应用的企业为零。
    一个值得被看见的问题是，如今在中国的土壤里，大模型的落地进展究竟如何？
    一、大模型落地，金融、能源先行
    “请帮我查一下我今年8月份的用电量，以及哪天用电最多?”“帮我检测一下这张图片有什么缺陷”……在南方人工智能创新平台上，通过语言交互，一项项数据清晰的被展现在眼前。
    在这个平台上，电力行业工作人员可以向电力大模型发布指令，让其自动生成数据处理结果，准确识别缺陷场景的图像细节，帮助工作人员检索处理电力巡检过程中的数据。
    目前，在南方电网客户服务领域，60%的高频问题都可通过电力大模型解决，在识别客户情绪波动方面，电力大模型的效果甚至优于人工。
    此外，在输配电领域，电力大模型已具备每分钟处理100张问题图片的能力，还能同时识别20类缺陷，识别效率是传统AI算法的10倍。
    而在电力调度领域，电力大模型能够协助调度部门针对电网异常情况快速自动化生成处置预案，及时响应电力市场调节要求，使预案更加安全、高效，成本更低。
    这是大模型在能源领域落地的一个缩影。
    据了解，部分能源头部厂商已经开启了与科技公司在大模型应用方面的合作，尤其在电网与矿山领域，形成了一些初步试点示范，如电网调度、缺陷/故障查询、煤矿作业监测等场景。
    除了能源领域，金融领域也是目前大模型最大落地场景之一。
    一份来自爱分析的报告中，也将能源、银行列为了大模型落地进展最快的两大行业。

    在金融领域的落地之广，从大模型的数量和企业动态也可见一斑。一组数据显示，截止8月，国内参数在10亿规模以上的大模型数量高达116个，其中金融行业大模型约18个。
    此外，在半年报中，工商银行、农业银行、中国银行、交通银行、招商银行、中信银行、兴业银行、华夏银行、浙商银行等9家银行明确提出在探索大模型的应用。
    在大模型厂商侧，一些密集的行业模型发布也反映出金融场景落地的火热程度。
    例如5月下旬，度小满发布了千亿级中文大模型「轩辕」；6月份，腾讯云携手神州信息开展金融大模型的合作，中国农业银行推出类ChatGPT的大模型应用ChatABC，中国工商银行发布了基于昇腾AI的金融行业通用模型。
    7-8月，随着《生成式人工智能服务管理暂行办法》正式实施，包括腾讯、百度、科大讯飞、华为、字节跳动等多家公司，又相继释放了最新的大模型进展；9月，蚂蚁集团也正式发布了金融大模型，并开源生成式AI编程平台CodeFuse。
    金融领域，无疑是大模型落地的最多场景之一。
    无论是能源领域还是金融领域，之所以能够实现大模型的领先落地，都源于这两个行业的一些共性。
    首先，能源和银行业都是高度数据化的行业，具有较好的数据基础和数字化环境，这为大模型的训练和应用提供了有利条件。
    其次，两大行业均有大量的数据处理和决策需求，而大模型的机器学习和深度学习技术可以帮助行业解决这些难题，提高决策效率和准确度。
    再有，能源和银行业的业务模式相对比较成熟，具有较高的商业价值，因此这些行业对大模型技术的需求也比较大，从而推动了大模型的落地应用。
    可见，能源和银行两大行业在大模型落地进展中相对较快，主要是由于其数据基础好、技术需求大、商业价值高等多方面因素的综合作用。
    值得注意的是，即使在金融、能源这两个落地场景中，大模型仍有一些目前难以跨越的难题。
    二、达不到预期的场景价值
    在金融行业，营销、风控、运营三个方向是诸多银行关注较多的大模型应用方向。
    其中，智能问答助手、智能客服、营销图片自动生成、贷后报告撰写是当下银行等金融机构积极布局的细分场景。但就目前而言，生成类场景如智能问答助手、智能客服、营销图片自动生成等场景价值与预期相差无几，但在如沉睡客户唤醒、数字营业厅这类决策、原生类应用场景，大模型落地的预期和实际效果仍有差距。
    例如在智能客服场景，过去智能陪练题库少，缺少针对性。如今基于大模型生产个性化题库，可以缩短培训周期上；在营销图片自动生成场景，过去设计师在素材库中选取并设计，如今可以利用Midjourney自动生成，可以降低版权成本和人力成本。
    而在沉睡客户唤醒和数字营业厅场景价值预期中，前者利用大模型自动生成策略，可实现端到端的策略改善唤醒效果；后者大模型支持的数字人帮助客户办理业务、推荐产品完成交易，可实现独立于APP之外的新渠道。
    然而，就目前来看，这两个场景的实际应用价值都尚未可知。
    能源行业的大模型落地应用亦相似之处。
    在能源行业，设备运检知识助手、智能客服等生成类应用，场景价值与预期相差无几。但在如检修文档、设备故障维修、电力负荷预测等场景，场景实际价值仍未可知。
    具体来看，在设备运检知识助手场景，过去是基于NLP技术构建结构化知识库，在大模型的加持下，可利用大模型构建运检助手，改善效率；在智能客服场景，过去是基于Bert模型的智能客服，如今利用大模型改善智能客服的用户体验，可实现意图理解更准确、语言更拟人化，用户体验得到改善。
    检修文档生成、设备故障维修、电力负荷预测场景中，大模型落地可带来的价值分别是，快速自动生成文档实现效率提升；大模型快速定位故障原因，提供检修建议和方案；纳入更多影响因素实时预测负荷，提高预测准确率。
    然而，就目前来看，这些场景中大模型带来的价值都尚未可知，仍需时间不断探索。可以发现无论是金融行业还是能源行业，生成类场景落地速度快，应用较多，决策类场景落地速度较慢且难度较大，应用较少。
    三、“生成场景>决策场景”：难转化的生产力
    就目前而言，大模型的落地仍处于试点应用阶段，并非全面上线。
    正如上文所言，金融行业的智能问答、智能客服、数字营业厅、贷后报告生成、沉睡客户唤醒、金融产品推荐等AI大模型应用已经逐渐落地；能源行业的智能客服、设备运检知识助手、检修文档生成、电力系统仿真平台、电力负荷预测等已经试点应用。
    然而，消费品零售、证劵、媒体还处于探索阶段，此外制造业、药企还处于观望阶段。
    由此可见，大模型落地虽广度上较为乐观，但深度上却较为艰难。
    大模型落地的深度取决于其能力、规模、计算资源、数据质量、领域知识等。然而，对于当下的国内大模型而言，处于发展初期，很多设施和能力还在逐步完善。
    受限于模型能力、应用效果等因素，当前落地应用以生成场景为主。
    与决策大模型不同，生成式大模型主要应用于文本生成、对话系统、语言翻译等领域，通过分析大量文本数据，学习文本的生成规律和内在语义关系，从而能够生成高质量的文本输出。生成式大模型的代表模型包括OpenAI的GPT系列和百度文心一言等。
    而决策大模型主要应用于推荐系统、强化学习等领域，需要处理的数据通常包含连续的数值变量，而且需要做出决策或预测未来的行为。决策大模型的代表模型包括DeepMind的AlphaZero系列和OpenAI的Dota2 AI等。
    相比决策大模型，生成式大模型首先在在文本生成和对话系统中，数据可以通过大量的文本语料库进行收集和整理，而在推荐系统和强化学习中，数据通常需要人工设计和构造，相对较为复杂。
    其次文本生成和对话系统等领域的研究已经比较成熟，有许多现成的算法和框架可以使用，而推荐系统和强化学习等领域则需要更多的探索和研究。
    再有文本生成和对话系统等领域的应用场景非常广泛，如搜索引擎、聊天机器人、自动写作等，而推荐系统和强化学习等领域则主要应用于电商、广告、游戏等领域。
    一个事实是，虽然生成类场景应用较广，但预测类决策场景是未来高价值场景。无论是大模型供应商，还是企业，想要基于大模型能力实现业务价值的提升，后者才是发力的方向。
    四、行业场景中，再看AI大模型
    大模型落地首先需要选择合适的领域和场景。该领域场景有着较强的数字化能力和数字化基础。
    例如，在智能客服领域，可以考虑将大模型应用于FAQ问答系统和聊天机器人等场景；在广告推荐领域，可以将其应用于电商平台的个性化推荐等场景；在舆情监测领域，可以将其应用于新闻媒体的内容分类和情感分析等场景。
    其次要具备较高的模型能力、应用效果等。而从当前企业用户落地大模型的主要路径来看，集团企业重点是大模型能力建设，一般企业/部门重点是应用场景探索。大模型能力建设分成三个层面：基础设施建设、大模型训练和大模型应用，当前以基础设施建设和大模型训练为主，大模型应用较少。
    值得注意的是，目前大模型应用方向主要分为两种，一是小模型为主，大模型提升小模型的开发效率；二是大模型与小模型级联，小模型连接应用，大模型增强小模型能力。
    而这种落地路径使得模型能力受限。
    想要推动大模型落地深度，大模型供应商、企业需要在能力、合作模式上不断探索。
    一些深化大模型落地的路径逐渐清晰。
    未来，随着大模型技术的不断发展和普及，模型级联的应用将会越来越广泛。
    例如，可以将多个大模型进行组合和级联，实现更复杂、更精准的语音识别、图像识别、自然语言处理等应用场景。同时，也可以将大模型和小模型进行级联，充分发挥各自的优势，提高模型的性能和泛化能力。
    基于此，扩展大模型落地的应用深度，加速各领域决策类场景应用落地。
    其次，不同行业有着不同的特定需求，未来大模型需要朝着更加定制化的方向发展。通过对行业特定语料库的训练，大模型可以更好地适应不同行业的实际应用场景。
    其次，为了更好地满足实际应用中的效率和资源需求，大模型需要朝着更加轻量级化的方向发展。通过模型压缩和剪枝等技术，可以在保证模型性能的同时，降低模型的大小和计算资源消耗。
    此外，随着数据隐私保护问题的日益突出，大模型需要更加注重数据的安全性和隐私保护。
    模型的定制化、轻量化、数据安全化成为其落地的重要因素。
    中国AI大模型的落地应用在智能客服、广告推荐、舆情监测等领域取得了一系列的成果。然而，在落地过程中也面临着诸多困局。未来，随着行业定制化、模型轻量级化和数据安全化等技术的发展，AI大模型的落地应用将迎来更加广阔的发展空间。