金融业“百模大战”正酣,如何在合规中突围?
进入2023年下半年,国内金融机构加快布局大模型。除银行外,保险公司和头部券商渐次加入“百模大战”。值得注意的是,消费金融公司也开始逐鹿大模型之战。
从开发模式看,与第三方合作仍是金融机构开发大模型的主流方式。相比于自主研发,合作研发性价比相对较高。
即使在大模型应用最广的客服业务,仍面临诸多问题。此外,金融机构App存在利用智能客服过度营销的现象,如,利用机器人电话频繁骚扰。
在合作模式下,金融机构关注的问题主要有三个:一是效率;二是安全;三是合规。
责任编辑:谢艳霞
金融行业正进入大模型时刻。
2023年11月6日,招联金融与中山大学联合研发推出消费金融行业首个130亿参数开源大模型——“招联智鹿”。这是继度小满、马上消费和蚂蚁金服之后,第四个公开的消费金融行业大模型。
事实上,传统金融机构也在加速大模型的应用落地。一些大型科技公司则在寻求与金融机构合作。金融业“百模大战”正酣。
金融大模型落地效果如何?面临的挑战是什么?对未来金融生态有何影响?
为此,南方周末新金融研究中心研究员通过调研各主流金融机构,实测各金融机构App,并查阅2023年主要专业论坛嘉宾发言等发现,2023年下半年,金融机构加快布局大模型,主要应用领域为智能客服、投资策略、风险控制和投顾投教等。
但目前科技公司与金融机构合作开发为主流模式。在此合作中,金融机构既担心大模型赋能业务效果,又对数据安全及合规有所顾虑。
南方周末新金融研究中心研究员认为,金融业大模型仍处于试验推广阶段,但趋势不可逆转。南方周末新金融研究中心研究员为此提出三点建议:促进“产学研”协同、加快立法、重视人才培养。
金融大模型遍地开花
金融大模型有何特殊?国际人工智能权威杂志《Nature Machine Intelligence》(《自然机器智能》)认为,大模型指参数规模到达亿级以上的“深度学习预训练算法”。通用大模型需要巨大的计算资源和数据量,对技术团队与资金支持要求极高,是国内外科技领域大厂的重点项目。
而垂直领域大模型专注于特定行业、领域或场景。因此,垂直领域大模型对算力和算法要求相对较低,但对特定领域数据要求较高。金融大模型即是典型的垂直领域大模型。作为现代高端服务业,金融行业具有数据量庞大、场景丰富等特点,与大模型对海量的高质量数据需求天然契合。因此,金融行业成为大模型率先落地的场景之一。
2023年下半年,国内金融机构加快布局大模型。除银行外,保险公司和头部券商渐次加入“百模大战”。值得注意的是,消费金融公司也开始逐鹿大模型之战。
南方周末新金融研究中心研究员不完全统计,在十九家系统性重要银行中,过半银行宣布已发布大模型或者正处于紧张筹备中。马上消费、蚂蚁金服和招联金融等消费金融公司也相继发布金融大模型,并自称处于领先地位。
不同金融机构大模型有何异同?南方周末新金融研究中心研究员研究发现,从业界实践来看,除工商银行和农业银行等少数头部金融机构在开发金融行业大模型之外,其他中小金融机构普遍选择与大型云厂商合作,针对某一业务场景进行试点。
南方周末新金融研究中心研究员进一步调研发现,智能客服几乎成为金融机构标配,如,工商银行“智慧柜员”、建设银行“班克”、交通银行数字员工姐妹花“姣姣”和“小姣”、江苏银行“智慧小苏”等。此外,不同金融机构在投资、风控、投顾和投教等领域均有使用AI技术。
从开发模式看,与第三方合作仍是金融机构开发大模型的主流模式。金融机构目前主要合作对象为百度、腾讯、阿里和华为等科技巨头,也有清华大学、北京大学等高校,还有恒生电子和宇信科技等金融科技公司。
相比于自主研发,合作研发性价比相对较高。度小满CTO许冬亮表示,千亿级别的通用大模型,训练一次需要付出几千万的成本。而此前亦有家机构媒体报道称,GPT-4一次训练时间接近100天,训练成本高达6300万美元。换言之,一年最多训练3次,每次花费约4.5亿人民币。
中小金融机构如何落地大模型呢?华为发布《数字金融:智领睿变,共建数智金融未来》报告显示,业界公认当大模型参数量达到620亿参数时,会出现能力喷涌现象。而目前很多开源大模型已经直接支持到百亿甚至620亿左右的参数集,大幅降低了AI训练门槛。
从技术角度看,追求大模型参数规模并不是中小金融机构最优选择。尽管理论上大模型参数规模越大,能力越强,但开发大模型目的是赋能业务、服务客户,而不是炫技。南方周末新金融研究中心研究员认为中小金融机构不必“卷”技术,可针对某一业务场景,选择十亿级、百亿级,甚至亿级大模型试点,充分发挥中小金融机构组织灵活性优势。
合作模式下,双方分歧大
在AI加持下,金融行业数智化转型正加速前行,但大模型对金融业务赋能有待进一步验证。
南方周末新金融研究中心研究员调研发现,在合作模式下,金融机构关注的问题主要有三个:一是效率;二是安全;三是合规。
在效率上,前中后台一体化的数智化整体解决方案是金融机构的核心诉求。在不久前的金融街论坛中,业界专家也共同探讨这一问题。天风证券前副总裁翟晨曦在担任第三届全球金融科技应用场景大赛决赛评委时提出,金融机构面临的最大问题是没有人做集成,导致前中后台数据接口不一,数据无法共享,在一定程度上导致内部沟通成本增加。
南方周末新金融研究中心研究员实测多款金融机构App发现,即使在大模型应用最广的客服业务,仍面临诸多问题。如,回答不准确、重复回答等。有些仅能接受“是或者否”的回答,而无法理解同义表达。此外,金融机构App存在利用智能客服过度营销的现象,如,利用机器人电话频繁骚扰。
许冬亮在金融街论坛中指出,在金融大模型场景端应用落地时,还需要处理好五大关键问题:一是基础模型应该怎么选;二是金融机构自身的业务数据怎么融到大模型中;三是如何控制幻觉问题等模型缺陷问题;四是未来每个机构都会部署大模型的情况下,机构如何构建竞争壁垒。五是模型的安全合规如何保障。
在安全方面,金融机构拥有大量市场数据、交易数据和客户数据。数据安全与隐私保护重要性不言而喻。
中国科学院院士何积丰曾在2023 INCLUSION·外滩大会上指出,大模型的安全问题主要是在未经同意的情况下,收集、使用和泄露个人信息。隐私问题既可能发生在训练过程中,也可能发生在使用过程中,而大模型的生成能力则让“隐私泄露”的方式变得多样化,造成隐私保护更加困难。
在合规方面,虽然与云服务商合作,采购它们的模型训练服务是金融AI训练的捷径,但金融业是强监管行业,涉及关键业务的数据往往因合规压力而难以上传公有云。
百融云创高级副总裁刘军也曾谈到,数据合规的风向主要有两个,一是外部风险,包括数据运用是否做到依法合规,黑客及犯罪团伙的恶意攻击等;二是内部风险,尤其是操作风险引发的数据外泄隐患。
南方周末新金融研究中心研究员认为,自2023年8月15日起施行的《生成式人工智能服务管理暂行办法》平衡科技发展和监管需求,体现立法者鼓励与监管并重的理念。期待《办法》实施能为中国生成式人工智能服务领域的发展带来更多的法律保障和制度创新。
生态共建是出路
仍处于试验推广阶段的金融大模型如何走向产业级研发应用?
恒生电子调查发现,67%的金融机构倾向于应用层合作,最关注的应用领域是投顾助手(56%)、合规内控(44%)、投资研究(25%),而客户服务仅占10%。这其中有客户服务领域AI应用较深的因素,但更重要是体现了金融机构对大模型赋能核心业务的期待。
金融大模型走向产业级研发应重视生态共建。这点在2023年各大专业论坛上专家观点中得到反复呼应。如,2023中国智能金融论坛甚至现场发起成立了“金融大模型生态计划”。
许冬亮认为,金融大模型的产业应用需要场景应用方(金融机构)、模型提供方、训练工具提供方等多方共建,共同参与。
人才是关键。在2023腾讯全球数字生态大会金融云专场上,腾讯云副总裁胡利明指出,现在头部金融机构都在招算法博士,尽管他们可以借力云厂商,但最终金融机构还是要具备自主使用和创新的能力,主导AI大平台的构建、优化及不断叠加新的应用场景。
中国农业银行研发中心北研平台三部处长赵存超也曾表示,在金融业大模型的深度应用,尤其是嵌入到金融场景的深度应用,数据是核心,安全是前提,算力是基础,场景是动力,人才是关键,协作是保障。
南方周末新金融研究中心研究员认为大模型应用是不可逆转的长期发展趋势,是加速数智金融转型,推动金融高质量发展的关键战略,但这是一项整体性、系统性、长期性工程,因此不能急功近利。
与此同时,合规与数据安全也不容忽视。在数智金融转型过程中,金融机构需要警惕合规风险,平衡创新与安全的关系。在数据治理中,边界清晰、规则明确是各方共识的基础,否则,会放大分歧,阻碍发展。
基于此,南方周末新金融研究中心研究员提出三点建议:一是促进“产学研”协同。加强同业和跨界交流合作,制定标准,规范流程,共创共享。二是加快立法。欧洲人工智能法已落地,中国版人工智能法草案也在审议中。三是重视人才培养。人才储备制约AI发展落地,因为不仅前期研发需要专业人才,后期运营及维护同样需要人才。
校对:星歌