从内容提效到合规管控，金融科技大模型的破局与突围｜年度盘点

2024.10.11 来咖智库

    LAIKA
     2024/01/18
    “AI+金融”新的应用突破，今年才刚开始。

    作者 | 追辛
    编辑 | G3007

    编者按
    已经过去的2023年，商业领域依然是波谲云诡，但有两条主线却受到各方的关注，甚至带动行业格局的重塑，其中一条就是以ChatGPT为主的AI大模型。
    回顾2023年，无论是从顶层制度设计的出台，还是全球科技界的狂欢，人工智能对千行百业的赋能开始进入了新的格局。来咖智库也注意到，在金融、教育和广告营销三个领域，逐渐成为AI赋能产业过程中最先烧起的“三把火”，但每一把火也都呈现出不同的发展特点和路径，比如“AI+金融”是最早落地的，“AI+教育”是应用最广的，“AI+营销”是变现最快的，这也构成了我们年度观察和思考的三个视角。本期为第一篇。
    过去的2023年，全球科技界开启了AI大模型的狂欢，除了通用型外，各个垂类大模型的百花齐放，更是备受业内高度关注。
    金融业作为数字化、全球化程度最高的行业之一，更是率先与新兴科技进行融合。2023年，金融机构纷纷掀起“百模大战”，行业想要依靠大模型产生新变革。其中乐信、奇富科技、度小满、蚂蚁集团等众多金融科技企业争先布局，先后发布落地了多项金融大模型，金融业正加速走向AI创新应用期，在金融信息触达、产品介绍内容的文本自动生成、市场营销、企业经营管理、构建虚拟客服在线交互以及风险管控等方面，给用户提供更人性的服务，提升了金融机构的工作效率。
    IDC的一项调研显示，超半数的金融机构计划在2023年投资生成式人工智能技术，只有10%的金融机构表示没有试验计划。
    那么，过去的2023年，国内金融科技企业在大模型方面取得了哪些突破和进展？在各自的大模型发展路径上，又有什么不同？对于业内迫切期望的智能涌现效应，未来金融大模型的发展又将面临着哪些挑战？
    01
    以月为单位
    金融科技公司的“百模竞速”
    2022年11月末，ChatGPT一经上线后，迅速在全球引发AI大模型的热潮。时至今日，这场科技界的大模型狂欢盛宴仍在持续，无论是在通用领域，还是垂直领域，千行百业都掀起了一场“百模竞速”。
    对金融大模型来说，金融科技公司都希望抢到“头啖汤”，从去年二季度开始，各家的自研金融行业大模型也是争先亮相。2023年4月，乐信推出了自研的金融垂直大模型LexinGPT；5月，奇富科技、度小满先后发布了“奇富GPT”和“轩辕”；6月份，恒生电子金融行业大模型LightGPT正式面世；8月，马上消费金融发布首个零售金融大模型“天镜”；9月，蚂蚁集团正式发布工业级金融大模型AntFinGLM等等。
    除了金融科技公司，基于通用大模型的开发和应用，更多的互联网和科技大厂也推出了针对性的金融行业解决方案。比如百度智能云基于文心大模型开发的金融解决方案“开元”，华为上线了三大类10个场景的金融大模型方案，科大讯飞基于星火认知大模型推出了金融行业大模型V1.0，还有腾讯云发布金融行业大模型解决方案……
    随着金融行业数字化转型的加速，越来越多的公司参与布局金融行业大模型。从过去的一年来看，金融大模型已在内容生成、智能营销、获客销售以及风险管理等业务领域开始发挥价值，涉及运营、客服、营销、风控、研究以及贷后等多个场景。尤其是相较于传统模式，大模型的加入更是极大提升了金融行业的运营效率。
    乐信在2023年三季报中披露，公司正在加速了AI大模型的落地应用，其中业务交互方面，已经在电销、客服、催收等主要业务流程中全面落地，比如信息流获客效能比一季度提升38.5%，新客的通过率、交易用户数、促成借款额都比对照组有20%以上的提升；生产力提升方面，在研发代码辅助、设计创意生成、数据分析等场景中广泛应用，提升公司整体的运营效率。
    在企业经营的智能决策方面，乐信方面还提到，基于海量精准的预测模型，公司开发了“图灵（Turing）决策仿真系统”——系统可以直接模拟多种真实经营场景，相当于企业经营的“模拟考”，并最快只需几十秒内就可以快速输出各项经营关键指标表现，模拟结果的精准度超95%。例如一个撮合匹配的优化策略, 原来实际上线测试几个月可能会耗费高额的成本, 现在通过图灵仿真系统, 90秒内就可以得到置信度非常高的结果。这样的快速反馈和高精准度给了乐信经营更大的灵活性和准确度。
    而奇富科技的大模型，目前也已经覆盖了智能营销、反欺诈、贷前额度、贷中调整，以及交易风险和智能机器人等业务的全生命周期，并且在小微业务、机器人、智能营销、研发及商业分析等领域进行了应用。
    据了解，去年第三季度末，奇富科技已为中国2450多万小微和家庭兼职小微用户赋予了适用于信贷场景的行业标签，便于今后能更好地根据行业特性服务小微用户的资金周转。具体在智能营销方面，有大约70%的图片素材由大模型生成，并通过大模型对素材进行标注和多维度评级，以实现广告投放的优化，同时大模型让营销素材的客户触达规模提升了21.4%。此外，在电销系统中，语义分析和线索挖掘帮助提升电销线索识别准确率高达98%，同时将转化率提高超过5%。
    还有度小满，也将大模型技术应用在各个业务场景，从营销、客服、风控、办公再到研发，已经初见成效。比如在代码助手方面，用大模型辅助生成的代码，采纳率能够达到42%，帮助公司整体研发效率提升了20%；在客服领域，大模型推动服务效率提升了25%。在智能办公领域，大模型目前的意图识别准确率已达到97%。
    从国内的AI大模型发展来看，主要分为通用大模型及行业大模型，前者具有更广泛的的应用范围，可以在多个领域内发挥作用；后者针对法律、医疗、金融等某个特定领域或行业，在垂直领域内具有较高专业性和针对性。据熟悉金融科技业务的人士透露，大模型对金融机构的赋能可以是全方位的，涉及金融业务流程中与人相关、人机交互的等各个环节，但现阶段金融大模型的价值，主要在于对大规模数据的理解、加工和分析，以及让工作流程更加流畅和低成本，以实现提质增效。
    华西证券的报告指出，随着大模型技术与业务的深度融合，头部金融科技企业有望实现产品和商业模式的革新，实现从产品+服务收费向SaaS订阅收费、运营分润收费的转变。
    02
    金融大模型的殊途同归
    算法和数据成关键
    从各行业来看，金融业沉淀了如金融交易、客户信息、市场分析、风控等各个方面的海量数据，并催生出大量高效处理的技术需求。同时金融行业持续进行数字化转型，以往对数据的收集、处理、清洗等工作也都做得较好，有着良好的数据基础，这也是为什么在大模型演进过程中，金融业走得较快的重要原因。
    对于金融机构在GPT产品方面的需求，奇富科技曾在去年5月对104家中小金融机构进行了访谈，其中的结果显示，金融机构对GPT产品的需求主要集中在改善用户体验、辅助风控决策以及资料查询与信息提炼这三个方面。
    一般来说，从大模型行业应用路径来看，科技巨头提供通用大模型，或者技术能力强的金融科技公司提供金融行业大模型，具体的金融机构基于这个行业底层模型，用自己的业务数据去做私域训练，然后做私有化的部署和应用。过去的一年，对于那些选择探索开发自有大模型的金融科技公司，在大模型的发展方向以及侧重点方面，其实也呈现出不同的路径选择。
    以乐信的LexinGPT为例，依托近2亿优质高成长的年轻用户的行为画像以及真实交易链路数据，其金融大模型更加注重与业务场景的融合应用。通过梳理清晰这些海量数据关系（数据库量级大致在百亿至千亿之间），并形成了不同场景下、用于预测用户行为偏好的众多精准模型，包括：借钱意愿度模型、营销偏好模型、offer满意度模型、还款意愿度模型、客户流失预警模型等，乐信迭代和完善了用户生命周期全局模型，打造出一套领先的全链条量化经营的系统，提升运营效率和客户体验。未来，乐信还会将AI和大模型应用于金融科技全链条实现精细化运营。
    而奇富科技所打造的金融大模型方向，是借助自身在“软硬结合”的优势和积累，成为金融领域的“AI专家”。比如通过技术不断加深对金融行业与用户需求的理解，并持续优化数据分析与处理能力、算法与AI技术、夯实算力储备，软与硬相互绑定，以更好地赋能金融行业，更具有普适性。与此同时，奇富科技还特别注重大模型在最终输出答案的可信度和合规性。比如针对大模型在内容真实性与内容合规方面的痛点，奇富科技依靠一系列政策规范文档与条款，形成了丰富的信贷合规处置经验，并以此完成信息围栏的构建，让大模型安全可控。
    奇富科技首席算法科学家费浩峻还提到，大模型并不是越“大”越好，如何在有限算力内提升模型效果，使实际业务应用更快更高效，是首先需要平衡的。“我们希望把模型‘做大’后再‘做小’，做大是把它的能力做大，比如像Chat GPT这种千亿参数的模型有很强的能力，保持能力不变的同时把参数做小，结合多种场景运用到垂直领域中，会实现更好的效果。”
    此外，也有像华为、马上消费、星环科技这种“另辟蹊径”布局金融领域大模型的玩家。华为依托于盘古大模型，以金融级PaaS解决方案的方式切入金融场景；马上消费的“天镜”大模型则凭借着“三纵三横”技术布局扎根金融行业全链路；数据库厂商星环科技在自研金融大模型“无涯Infinity”的同时，还提供了一站式的企业自建大语言模型工具链，尝试两条腿并行。
    对于金融大模型的落地应用途径，中国工程院院士邬贺铨建议，机构可从可控入手开发应用，例如智能客服、智能运营等安全的领域出发。再从人机混合智能切入，例如在初期阶段先让金融大模型与传统模型共存，经应用考验后再将金融大模型逐步替代传统模型。同时还可以通过变换场景，丰富大模型的场景迁移学习能力，或加入反事实的数据来测试，改进AI的学习本质，提高模型的泛化能力。
    尽管各家都有不同的发展路径，但可靠性仍然是大模型在金融领域落地最大的鸿沟。为了将大模型更好地“缝合”到业务场景中，提升可靠性、安全性和流畅度，各大厂商的主流方案有三种：一是将大模型与专业领域的小模型结合，大模型负责认知、理解、沟通、创作，小模型负责把握风险、承载严谨的逻辑；二是将大模型的参数知识与结构化、显性化、可靠的金融知识图谱相结合，此举能很好地为大模型注入可靠性；三是将开放QA（问答）和封闭QA的结合，让大模型得到请求指令后，在专业知识领域内进行检索，大幅提高准确性。
    对于金融大模型竞争中的核心问题，毕马威中国金融科技主管合伙人黄艾舟认为，这取决于最关键的是两个能力：第一个是算法，因为好的算法能够使得需要的参数减少，同时产生更好的效果，但这需要顶尖的AI科学家。第二个是数据的质量和数据的规模，如果已经有了经过标注的数据，那一定会提升模型的性能和模型产生的结果，同时通过大规模数据的不断学习和训练，才能有智能涌现的能力。
    03
    应用突破年
    金融大模型未来的三大挑战
    工信部赛迪研究院日前发布的数据显示，2023年我国语言大模型市场规模实现较快提升，将达到132.3亿元，增长率将达到110%，而且应用场景不断丰富。而随着AI技术产品化、产业化以及商业化，2024年将是大模型发展的重中之重，在应用层面有望实现新的突破。
    对金融大模型来说，现阶段最容易实现的包括AI投资顾问、自动化客服、风险评估、报告自动化生成、代码生成应用等较为外围的工作，但如果要将AI进一步渗透到风控等金融核心业务，还需要在垂直领域进行磨合，经过长时间的考验，才能进入到更为核心的金融业务中。
    而在未来发展方面，金融大模型也面临着一些挑战。这首先来自于数据安全合规的采集、管理和使用。因为金融行业本身对数据安全和隐私合规有着严格的要求，注定了金融大模型在采集、传输、加工及处理信息的各个环节，都要比通用大模型乃至其他行业大模型更为谨慎。而且数据又是不同金融机构的核心生产力，关系着自身的护城河问题。大模型发展需要高质量数据集，同时又受限于自身远远不及通用语料的数据规模，就必然需要不同业态完成数据共享，如何构建一个合理且安全的机制，考验的是整个金融行业的智慧。
    其次是大模型的迭代和训练，成本高、成本大，模型需及时调整，也有一些金融机构选择利用大数据的整合，在垂直领域精调模型，以小规模算力打造轻量级精调模型。金融的本质是风控，大模型优化金融业务流程和用户体验的同时，要将风险降到最低。
    也因此，目前大模型在金融垂直领域仍未挖掘出涌现效应，一方面是由于金融数据及知识的私密性导致难以共享，无法构建一个庞大的数据集，对此可以增强产学研的联动性，共同构建更强的金融垂直领域基座模型。另一方面由于金融数据模态更多，难以进行统一的处理建模，而如今的大模型对此种多模态的表达能力仍有待加强。
    最后，金融大模型的发展，还要处理好金融业务数据如何融入到大模型中，以及如何控制幻觉问题等模型缺陷问题。所谓“幻觉”，指的是人工智能模型生成的内容，不是基于任何现实世界的数据，而是大模型自己想象的产物，即给出事实错误或者是一些看上去权威正确的虚假信息。可以说，生成式大模型非常擅长创造，往往创造有余，但准确性不足。且金融领域的本质是复杂决策、低容错率，这远远比对话聊天困难得多，通用模型里面的专业知识远远不够，如果无法有效发现“幻觉”中的漏洞，那么将很可能导致金融大模型出现理解或判断上的偏差，直接影响风控效果。
    就当前而言，成本较高、金融数据不充分，落地场景和大模型之间实际预期业务价值之间存在差异。企业对模型精度和效率要求更高，尤其是一些专业性强、知识密度高的领域，大模型的表现存在输出结果不受控、可解释性较差、可信程度较低等情况，从而限制了其应用场景。此外，在新技术的应用过程中面临伦理道德、价值观上带来的挑战时，人工智能带来的伦理问题需要法律法规约束，这些在未来都需要进一步厘清和给出明确的规定指引。
    结语
    作为数字化转型核心技术驱动力的金融科技，借助大数据、人工智能、区块链等技术，特别是AI大模型技术的崛起，有望引领金融科技领域的革命性变革，重新定义整个行业的价值。但是这个变革过程并非一帆风顺，还面临着安全、合规、算法和生态等方面的挑战，迎接这些挑战，既需要行业的决心，也需要企业的长期定力，对于已经率先布局大模型的金融科技企业来说，今年才刚刚开始。