金融智能体走向规模化应用 仍有四项“基本功”不足

beiqi 热点新闻 9

  21世纪经济报道记者李览青、吴霜 上海报道

金融智能体走向规模化应用 仍有四项“基本功”不足
(图片来源网络,侵删)

  一年一度的世界人工智能大会(WAIC)即将落下帷幕,今年,无论是逛展还是旁听论坛,观众的感受都是:AI越来越务实了。

  金融行业也不例外。在位于上海浦东的世博展览馆中,21世纪经济报道记者走访了交通银行、农业银行、上海银行、蚂蚁集团、中电金信等展商的展位发现,人工智能已经开始释放数字劳动力、重构金融业务交互方式。

  以近两年最火热的AI应用——智能体为例,在2024WAIC期间,业内人士仍将金融智能体看作“校园优等生”,一年之后的现在,部分科技厂商在金融领域的智能体应用解决方案已超过100个。不仅如此,从落地场景来看,金融智能体也从对客辅助工具的“单点尝试”走向授信决策等核心业务场景,逐步实现规模化应用。

金融智能体走向规模化应用 仍有四项“基本功”不足
(图片来源网络,侵删)

  在多位从业人士看来,原本就根植于应用场景、为解决实际业务问题而生的金融智能体,将在大模型驱动下实现金融业务流程的重塑,整合软件能力、专家经验、决策路径,从而提升业务效率、激活数据价值。

  金融智能体应用拓宽拓深

  “今年我参加WAIC最大的感触是,与去年相比,无论是从深度还是广度上,AI应用都产生了非常大的变化,如雨后春笋般涌现。”在展位上,中国电子首席科学家、中电金信研究院院长况文川向记者表示。

金融智能体走向规模化应用 仍有四项“基本功”不足
(图片来源网络,侵删)

  金融智能体的应用也在拓宽、拓深,这既体现在落地场景数量的增长方面,也体现在对业务效率的提升方面,甚至开始对服务模式产生变革。

  “智能体的价值不在于解决1000个浅层问题,而在于攻克1个行业的深层痛点,智能体要围绕场景出发,要深入企业的业务场景,将专业领域知识的价值最大化,这才是产业落地的关键。”蚂蚁数科CEO赵闻飙在论坛发言中表示,数字化程度最高、数据密度最大、AI应用场景最丰富的金融业应当是AI率先落地应用的绝佳行业。

  安永亚太区金融科技与创新首席合伙人忻怡告诉记者,目前不同金融子行业的智能体应用探索方向有所差异,但都已从概念验证走向规模化应用。如头部银行已实现“通用大模型+垂类模型+智能体”的技术架构落地;证券业头部券商推出多款AI应用产品并投入实战场景;保险业着力推进智能理赔体系建设。

  记者在展区探展了解到,太保集团在保险业务核心环节全面推进数字劳动力建设,优化成本结构,目前已上线的典型数字劳动力包括健康险理赔审核、审计数字员工、产险在线理赔助手、寿险金牌讲师等等。在蚂蚁集团的展区,也展示了财富、保险、投研、风控等核心金融场景生产环境的智能体demo。在财富管理方面,盈米基金上线了“个人基金理财助手”“持仓诊断”“基金深度分析”“基金对比” 等一系列金融智能体应用。

  在应用深度上,金融智能体开始在重要核心场景上大展身手。

  以授信决策场景为例,奇富科技首席算法科学家费浩峻向记者透露,该公司搭建了授信决策智能体系统。他表示,“超级智能体”与传统风控系统相比有三个优势,从范围上来看,智能体系统涉及整个信贷业务的全流程,而不仅仅是风控场景;从能力值来看,智能体系统是“类人”操作,根据模型判断再进行编排决策,而传统的风控系统仅需遵循固定的工作流程;从系统本身构成来看,传统风控模式可以理解为“软件能力+大数据能力+小模型风险策略”的耦合系统,而智能体是以大模型为驱动,基于学习过去无数专家经验和决策路径,融合上述三个部分,减少人为决策,更懂金融业务与金融场景。

  与此同时,金融业务的交互模式已经发生变革。

  记者注意到,今年上海银行在展位上首次发布以“对话即服务”为核心的AI手机银行。打开手机银行App,用户无需在复杂的菜单栏中寻找功能,只要通过文字或语音在对话框中输入需求,AI可以快速响应并完成业务办理,覆盖转账还款、理财咨询、养老金管理等十余项高频交易。在现场演示中,有观众提出“有什么理财产品可以投资一下”,AI通过分析用户资产负债、现金流、风险偏好等信息,迅速从数百余款理财产品中选取出了几款。当进一步询问产品的风险、周期等问题时,AI手机银行也可以瞬时给出专业解读,操作流畅度堪比与专业银行顾问面对面交流。

  上海银行这一应用背后有蚂蚁数科的身影。赵闻飙表示:“以‘对话即服务’取代传统点选,更深层的意义在于,它重塑了服务本质,尤其在适老化领域,通过AI实现了服务的‘拟人化’,实现从‘人找服务’到‘服务找人’的突破性转型。”

  专业“基本功”问题犹存

  尽管金融智能体已实现规模化落地应用,但要让“专业的模型干专业的事儿”,仍需要专业领域的“基本功”。

  最首要的问题大模型幻觉犹存。费浩峻坦言,目前在一些场景下,智能体还是存在指令遵循不准确的问题,有时会产生幻觉,但如果人工通过技术手段干预幻觉问题,又有可能导致智能体的“智力”受到约束。况文川也表示,金融这一关键行业高度依赖于系统的自动化、精准化能力,大模型的幻觉问题、输出稳定性问题、过程可解释性问题,将成为智能体等AI落地应用的最大挑战。忻怡告诉记者,未来两年内,金融垂类大模型的落地应用,首先要解决幻觉问题.

  第二大问题在于碎片化的金融知识亟待整合。况文川告诉记者,专业模型的基础是行业高质量数据集,他指出:“这是一项基础性的工作,需要长期、耐心的投入,也需要很大的资金投入。”

  记者了解到,专业大模型需要对行业知识进行系统化的学习,其关键在于一个科学、专业的任务数据体系作为“课程大纲”,基于金融任务体系框架,还需要真实业务场景的数据,经过严格的质量评估、可信数据合成和CoT数据精标链路,才能形成可用于训练专业模型的数据集。

  第三大问题在于部分金融机构缺乏将业务需求、算力、模型、数据、知识库、应用等一系列协同的工程化实践能力。“现在市面上很多公司说是在做AI、做智能体,其实只是在原有算法基础上做了重新再包装,并不能基于AI的方法论做业务场景的重构。”某科技公司商业化团队负责人告诉记者,这个问题主要出现在“基于场景切入的AI应用”上,他认为,真正实现AI落地应用离不开全系统协同的工程化能力。

  第四大问题在于衡量智能体落地应用的实效。费浩峻表示,在框架层面需要一个开放透明的评估体系,在智能体应用层面需要将众多信息还原成可以评估的数据指标,才能实现智能体的准确度评估,这是一大难点。

  这主要源于大模型的“成长飞轮”发展逻辑。所谓“成长飞轮”,简而言之就是通过不断使用、迭代训练,使得模型自身“转起来”,实现“越用越聪明”的应用能力增长。然而,如果在数据质量、安全底线等方面出现问题,可能会让“飞轮”终止运转。

  因此,通过评测实时评估智能体迭代成长的能力水平,成为关键。“在软件工程时代,以质量评估为代表的评测是最后一环的风险拦截,但AI时代的评测将成为整个智能体迭代成长的起点。”前述科技公司商业化负责人表示。

发布评论 0条评论)

  • Refresh code

还木有评论哦,快来抢沙发吧~