金融大模型,要听见远方的风

脑极体

金融大模型,被认为AI大模型产业化落地的第一站。
    金融行业有着结构化数据充沛、应用场景丰富、数字化基础设施良好等一系列特点,这些都是融合AI技术的利好因素。所以当AI大模型开始爆火之后,各界会不约而同认为金融是AI大模型的天然良港。
    从2023年至今,中国金融大模型市场的发展也确实印证了这一判断。根据相关数据,目前中国市场已经有近20个金融大模型落地应用,头部金融机构要么已经应用AI大模型,要么展示了对AI大模型的研发与应用计划。
    
    要知道,在降本增效的大背景下,金融机构目前还需要兼顾移动金融、数字系统自主替代等多项数字化投资目标,能够分给AI大模型的资源并不丰富,而AI带给金融机构的投资回报比还非常有限。高效上马大模型,对金融行业来说真的值得吗?
    记得2023年我在参加一个金融科技峰会时,与一位银行代表进行沟通。他提出金融机构做AI大模型,最根本的动力是担忧。在移动互联网时代来临前,全球金融行业普遍低估了新技术带来的冲击力。随后被Apple Pay、支付宝、微信等移动互联网平台分润了时代红利。不让类似境况重演,是驱动金融机构加码AI大模型的底层动机。
    如果是这样的话,金融行业仅仅快步走向大模型并不够,同时还需要听见远方的风,要能够从长期目标来回溯中短期的行动规划。
    今天,我们就从这个观点出发,聊聊快速用上了大模型之后的金融行业,接下来走向何方?
    金融大模型,从高速覆盖1.0,走向价值最优2.0
    从全球到中国市场,生成式AI带来的大模型之变,都在一年多的时间里掀起了金融行业的科技革新浪潮。
    在国际上,OpenAI将金融行业视为GPT技术落地的首站,比如其与摩根士丹利合作,推出了基于 GPT-4的投资顾问机器人。
    而在中国金融行业,AI大模型可谓以前所未有的态势得到了高速覆盖。在短短一年多的时间里,处于头部地位的银行、券商以及保险机构纷纷完成了金融大模型的落地应用。
    比如说,工商银行就宣布建成了同业首个全栈自主可控的千亿级AI大模型技术体系,并在多个金融业务领域实现了创新应用。例如在网点运营上,推出了基于大模型的网点员工智能助手。农业银行AI推出了类ChatGPT的AI大模型应用ChatABC,并在科技问答场景进行了内部试点。邮储银行通过接入百度“文心一言”,从而在智能风控、智能运营、智能投研、智能营销等场景进行大语言模型应用。
    
    在民营银行层面,网商银行将大模型技术应用于产业金融层面,从而识别小微企业的信用画像。在保险行业,众安保险搭建了“众有灵犀”系统,将大模型带入智能客服、到期提醒、智能运营等业务场景中。
    而从技术与解决方案供应商的层面看,目前中国市场已经呈现出多样化的金融大模型技术供应渠道。腾讯云、蚂蚁金服都推出了金融大模型解决方案。面向金融行业既需要大模型落地,同时也需要基础设施更新的需求。华为在2023年依托盘古大模型,推出了金融级PaaS解决方案,发布了包括AI for Data、AI for Business、AI for IT三大类10个场景的金融大模型方案。
    而在开源大模型层面,度小满开源了轩辕大模型,其在1760亿参数的Bloom大模型基础上训练而来,已经应用在度小满各个业务场景,覆盖了从营销、客服、风控、办公到研发等场景,并在一系列大模型评测中取得了领先地位。
    可以看到,金融大模型已经快速走过了以高速覆盖为特征的1.0时代。在第一阶段,金融大模型相关技术与解决方案快速出炉,头部金融机构竞相试用,为中国金融大模型的发展打下了良好的基础。
    金融大模型第一阶段的发现成果显而易见,比如说,技术发展速度快,用户积极性高。同时金融大模型的业态覆盖非常完整,从银行到保险、证券等领域兼顾,此外相关的技术能力供应链已经完善。闭源模型与开源模型兼顾,多种部署方式完备,与金融大模型相配套的软硬件基础设施已经较为齐全。
    但在接下来,金融大模型需要从具有探索性质的1.0阶段,走向必须要求回报率,要体现长期发展价值的2.0阶段。
    这一阶段,金融大模型需要面临的挑战更加复杂,同时战略方法论的问题也将浮出水面。
    已经暴露出的挑战
    统观金融大模型的落地进程,会发现其中表现出的优劣势逻辑,与此前AI技术落地金融业如出一辙。第一阶段,行业会直观感到AI很好用。但接下来,AI能否带来充足的投资回报,能否深入业务核心,才是更大的挑战。
    目前,金融大模型也遇到了类似问题。首当其冲,大模型所带来的智能幻觉、数据污染等问题,与金融行业对专业性、安全性的极高需求是难以匹配的。
    
    其次,由于金融行业极高的涉密等级与安全合规要求,往往需要私有化进行大模型部署,同时禁止模型学习大量数据,禁止数据过分流动。这又催生了两个问题,一个是私有化部署给金融机构带来了极大的研发与运维成本压力。另一个是高安全等级与限制数据使用,带来了金融大模型效果不佳等问题。
    对于金融机构来说,不仅是研发、训练大模型的成本过高,将模型进行场景化部署的成本压力也很大。由于目前金融大模型还处在探索阶段,难以带来实际的商业回馈,因此其部署往往是在机构内部,或者边缘业务中。这就导致部署成本不断放大,但商业化价值却迟迟无法释放。
    最后,也正是处于金融行业高安全,与大模型技术不够成熟二者间的差距。金融大模型普遍无法在金融核心业务中进行部署。比如大模型加持的智能客服,不仅无法代替客服人员,还可能出现需要频繁唤醒人工客服,且需要客服重新理解用户需求的现象。而在风控等产业应用侧,大模型虽然表现出了巨大的潜力,但还无法真正处理较为复杂的风险异常。
    这种情况下,金融大模型很可能在运行一段时间,热度相对褪去之后,又和许多金融科技一样流于边缘化。
    如何才能突破技术与产业之间的长期壁垒?这可能需要金融大模型听到一些来自远方的风。
    从未来,回看现在
    布莱特·金在著名的《银行4.0》中,第一章就在讨论第一性原理的回归。即我们需要回归问题的本源,回归设计的本质。放在金融场景,就是我们首先需要理解银行被设计出来是为了什么,继而在讨论银行应该如何发展。
    想要打破金融大模型可能面对的壁垒,我们也必须有这样一个意识:去思考,去判断,甚至去假设未来大模型究竟能给金融带来什么,再从未来倒推现在。
    哪怕这个未来相对遥远,至少远方的风不会带我们走进死胡同。
    那么,AI大模型到底能为金融带来什么?
    这个问题可以分为两个维度去理解,一个是技术维度,一个是应用维度。
    从技术上看,大语言模型的技术升级路径已经相对确定,业界对其技术发展范式以及工程化实践已经有了明确的共识。
    

比如说,最近我们读了由度小满金融技术委员会执行主席、数据智能应用部总经理杨青所撰写的《大语言模型:原理与工程实践》。书中除了明确提出了大语言模型的多项关键技术之外,还指出了其在涌现能力、推理能力上的特点,以及广受关注的大语言模型缩放定律。随着模型训推能力的提升,大语言模型将持续出现智能涌现效果。这一技术锚点是金融行业所追寻的长期价值,也是度小满等金融科技供应商探索大语言模型的价值关切。
    而从应用维度看,目前金融大模型的应用场景繁多,但归根结底可以总结成三个方面
    

  1. 面向大众用户的智能客服-智能顾问。
  2. 面向产业用户的智能信贷识别-信用体系构建。
  3. 面向金融机构内部的职员能力提升。

    
    这三种能力的极致化,就是金融大模型可能带来的长期价值。比如在未来,以大语言模型驱动的智能客服,可能会变成智能顾问、一对一的金融服务专家。不仅可以完成业务对接,信息告知等基础功能,还可以结合用户需求给出定制化的金融方案,实现金融订制能力从大额用户、企业用户向普惠用户的转变。
    将技术维度与应用维度进行综合,我们可以将金融大模型的未来锚定在三个方面:
    1.企业与个人信用服务的智能泛在化。
    2.金融客服的少人化甚至无人化。
    3.金融机构综合智能能力的极致化。
    如果说,移动金融是把银行、券商直接开到了用户手里,是让金融距离用户更近,那么AI大模型金融,则是让用户走得更远,让用户的一切诉求与资产都可以与金融服务建立联接。
    用远方的风,丈量现在的路
    一段时间以来,金融大模型领域存在着务虚与务实的争论。
    所谓务虚,是指金融机构应该更关注算法本身,关注模型性能,先上马大模型,拿着大模型的锤子找金融业务的钉子。
    而务实则是要求从金融行业的应用场景出发,优先考虑金融应用智能化的安全合规与成本可控,在此基础上再去适配裁剪大模型的能力,让大模型为金融服务。
    某种程度上来说,二者都有正确的因素,但或许也都可以补充新的思路。因为二者都更加关注短期抉择,忽略了金融大模型的出发点是行业的跨时代升级,是寻求像移动金融一样,甚至更加深刻的长期变革。
    金融大模型需要补充的思路,就是务实务虚之外,需要务未来,需要从最终可能实现的理想化目标,来一步步推导现在的工作。让远方的风,吹动现下的脚步。
    从这个角度看,金融机构就需要兼顾上马大模型的效率,同时兼顾未来可能随时出现的更多AI技术创新。让自身的数字化架构与软硬件基础设施,适配随时会到来的AI技术迭代。具体来看,“务未来”的金融大模型,可能包含以下三层行动:
    
    1.打好金融大模型基座。其中包括自身的研发体系,也包括与技术供应商之间开放有效的合作关系,避免因过度保守而遭遇技术搁浅。
    2.兼顾金融大模型的工程力与想象力。面向大语言模型的长期发展,金融行业不能局限于有大模型,更需要锤炼对大模型的工程化掌控力,随时可以将大模型锤炼成符合自身需求的状态,同时积极开启创造性的大模型探索。既在内部酝酿变革,也不放过外部机遇。
    3.构建长期且清晰的智能化目标。对于金融大模型,我们要正视其短期的局限性,以及长期的可能性。在战略上回归大模型最本身的第一优先性原理,然后以此为目标倒推每一步的进展。
    当大模型出现在金融业面前时,我们的第一感受都是惊喜与遐思。但在实际应用大模型时,往往会过于聚焦眼前,比如是否使用了大模型,覆盖的业务场景,以及带来的投资回报率。这时,浮现出的挑战以及不那么清晰的价值往往会滋生矛盾,让金融机构进退维谷。只要让远方的风吹进来,让金融智能化的长期主义映照现在,绝大部分问题都会找到解法。
    

P.s.本文写作过程中,《大语言模型:原理与工程实践》带来了许多启发与帮助,特此感谢。
    
    书中详细介绍了大语言模型的工作原理,如何评估大语言模型的性能,以及大语言模型在金融场景的实际操作方案。
    相信无论是计算机与AI领域的产品、技术、研发人员,还是金融行业的从业者,都能够从中获益。