招商银行如何利用AI提升审查效率和准确率?
银行界的“零售之王”招商银行,一直是金融科技理念的前沿践行者。近年来,人工智能已经在其前中后台各个业务场景中广泛应用。
以金融“命脉”风控场景为例,招商银行在零售条线依托金融科技能力,构建了智慧风控生态体系,打造了包括智慧风控、智能风险调查、综合身份认证等在内的诸多平台,将风险感知、实时决策、风险调查等能力整合,形成覆盖可疑账户和风险交易的全生命周期风险管理闭环,实现对潜在被骗交易的精准高效甄别,阻断风险交易,避免资金损失。
其中,智能审核系统作为整个风控生态体系的关键部分之一,通过整合自然语言处理、语音识别、图像处理等多项 AI 技术,解决了金融领域繁琐的审核工作,实现了机器辅助人工对各种不同类型材料进行审查,大大提升了业务开展的效率和准确性。
在日前的 InfoQ《超级连麦·数智大脑》直播节目中,招商银行人工智能实验室算法工程师赵文婷分享了招商银行智能审核系统的建设历程及应用成果。她表示,目前该系统已经完成了基础能力搭建,可以解决大部分文本、语音、视觉审核场景。但与此同时她也坦言,不管是场景还是能力方面,该系统都还有很多提升空间。比如,小样本场景复杂语义推理的审查目前还是个难点,利用目前现有的技术手段去解决投入产出比比较低。对此,今年流行起来的大模型在类似问题上表现出了很好的效果,招商银行未来将在这方面进行进一步探索。
以下是对话全文(经 InfoQ 进行不改变原意的编辑整理):
赵文婷:人工智能对银行数字化转型是至关重要的,比如说像银行的风控合规、营销拓客、服务体验提升等各个方面,现在人工智能都已经在其中起到了关键作用。尤其是最近大模型的爆火,又为金融科技的产品落地带来了很大的想象空间。
具体而言,人工智能已经在银行的前中后台各个场景中应用的非常广泛。
比如在风控场景,像人脸识别、指纹识别、声纹识别等核身技术在我们手机银行的应用,通过多模型、多模态的应用,极大地保障了我们的客户登陆交易安全,避免了资金财产损失;
比如在这次 FCon 大会上我将要分享的智能审核系统,其实也是结合语音、语言、视觉等多模态处理技术,实现了机器辅助人工做各种类型材料审查,也是在合规和提效上有较大突破;
再比如客服场景,通过多种 AI 技术结合,包括意图理解、信息抽取、知识图谱等等,可以帮助银行打造了手机银行智能客服、智能外呼,通过机器辅助人工坐席做客户服务经营等工作,从而提升服务效率和客户满意度。
另外像营销拓客,我们也可以通过大数据挖掘和语义理解等多种技术结合,辅助做 kyc 分析和服务方案生成工作,进而服务经营拓客,提升营销效率和质量等;
而针对交易场景目前我们也有很多成功的 AI 赋能应用了,比如说 AI 智能理财助理,其实就是在投研这样的环节提供辅助,包括产品推荐、精准营销等等。这个过程可能客户不能很直观感受到,但是底层基于的正是 AI 技术。
目前我行已把 AI 技术应用于行内业务流程的方方面面,后续也会持续关注最前沿技术为业务赋能。
赵文婷:银行业对风险是非常关注的,在业务开展的全生命周期风控始终是放在核心位置的。例如像我行的零售条线依托金融科技能力,构建了智慧风控生态体系,打造了包括像智慧风控平台、智能风险调查平台、综合身份认证平台等,将风险感知、实时决策、风险调查等能力整合,形成覆盖可疑账户和风险交易的全生命周期风险管理闭环,实现对潜在被骗交易的精准高效甄别,阻断风险交易,避免资金损失。此外,我行也运用大数据风控模型,去做风险预测模型,然后在信贷业务上的贷前、贷中、贷后进行不同等级风险预警。
其中,智能审核系统更多是在整个风控体系的事中、事后环节赋能,智能审核着重在事中环节辅助加快业务办理效率,降低由人工主观标准不一致带来的审核误差,同时辅助事后业务回检,排查异常交易风险。审核系统与其他风控系统互相结合,持续降低业务开展过程中各类风险。
赵文婷:过去银行主要由人工去把控和审核风险,依赖人脑对内外规则和监管知识进行积累和记忆,并且审核的时效和效率都是相对滞后的,因为人工从初审到复核整个全流程周期会拉得很长。
另一方面,如前面所说,人工处理可能会存在审核的主观差异,尤其是针对一些相对复杂的条款的理解。比如像销售环节要求从业人员不能夸大销售、虚假营销,这就比较抽象,什么样的程度算是夸大营销,可能不同的审核人员会有不同的理解,这可能造成审核漏洞的风险。
所以,通过引入智能化技术,一方面是为了提高审核效率,另一方面也是为了降低人为的理解误差,统一标准。
赵文婷:银行业作为知识密集型领域,其各个业务场景每日能够产生大量的不同模态非结构化数据,如产品合同、债券发行材料、营销电访通话、运营票据、双录视频等。为贯彻落实监管部门关于业务开展过程中各项规定,降低合规风险、提升服务质量,行内每年需投入大量人力做质检审查工作。
为提升审核效率、降低合规风险,行内通过结合自然语言处理、语音识别、图像处理等多项 AI 技术,充分学习利用各类业务文档、规章制度等领域知识,提供了一套具有较强泛化性、以机器辅助代替人工可支持全量实时质检的多模态智能审核方案。
目前完成了基础能力搭建,可以解决大部分文本、语音、视觉审核场景,但不管是场景还是能力上还有很多提升空间。比如,小样本场景复杂语义推理的审查目前还是个难点,利用目前现有的技术手段去解决投入产出比比较低,可能随着后续大模型的普及应用,会有更好的解决办法。
赵文婷:一方面,我们看到审查场景涉及的数据量实际上比较大,但过去受限于人力,可能没有办法实现全量质检审核,而现在通过智能化审查系统,就可以做到实时全量 100% 覆盖的质检;
另一方面,针对不同场景,智能技术带来的效率提升和时效性辅助还是比较明显的。如果在模型推理层面没有太多消耗的话,比如一些初核初审流程可以从过去人工模式的几分钟甚至数小时,到机器全自动化,达到分钟级甚至秒级的响应。
赵文婷:不同场景底层能力基本一致,但对外业务流程不同、场景不同,解决方案和模型搭建逻辑上会有些许差异。
比如产品合同、债券审核更多是纯 NLP 的应用,这些场景的特点是审核点复杂,因为内外监管要求更多,所以发行逻辑以及各方面的业务指引,所需的材料要求也是比较多的,同时它们的自定义审核内容较多,样式不固定、不统一。这时候,就需要更多复杂的自定义组合模型去做支持和应用。针对这样的场景,我们更多是复用审核系统的审核模式,在通用基础上接入适配训练的个性化抽取及推理模型。
但是,以票据审核场景为例,采用的就是 OCR+NLP 的结合。因为票据审核的处理模式和前两个场景不一样,它针对的是图像的模态数据审核,虽然票据审核点简单,但审核内容繁琐,需要在审核平台先配置大量审核规则,然后重点优化 OCR 和要素抽取效果,通过 OCR 先做图像文字识别,再做结构化信息抽取及逻辑判断。这与纯文本就会有很大的不同。
所以我们在做票据审核的时候,主要先通过 OCR 先做智能识别录入,并且针对不同类型的票据在前面的环节重点去定制化训练它的识别模型,从而提升识别的准确性。在识别之后,通过在审核平台上预先配置的大量审核逻辑去做推理,比如中间要素的一致性、必备性等等,进而去做后续的判断。
赵文婷: 在整个审核环节中,人和机器的协作模式是非常多样的,审核人员在其中肯定发挥着最重要的作用,机器更多是做一些辅助,帮助人工提升效率,降低相关的风险。
当然,依据不同场景业务开展时效性及风险性程度的不同,人机协作模式会有一定差异。
比如,像票据审核这样对业务准确率要求比较高,高风险时效性要求较强的场景,我们会采用一人一机实时双审模式,通过机器自动录入,结构化信息提取,机器做初审,人工做复核完成审查。
而对于像经营分析、合规分析等这样低风险低时效性要求较低的场景,我们会通过机器实时全量质检 + 人工抽样复核或机器初审 + 人工批量复核完成。
赵文婷:在实现智能化应用的过程中,人机协作是非常重要的。比如,在机器初审之后,需要人工去做复合,对质量进行最终把控;再比如,在审核模型构建初期,同样离不开人工干预,包括对模型进行反馈和调教。
但是,这并不是为了明确机器发挥多少作用,人工发挥多少作用,而是希望通过各种 AI 手段把人力从一些繁琐枯燥的工作中释放出来,去做一些更复杂的、对他们来讲更有意义的事情上,把相对简单确定性的任务交给机器去做。对我们来说,其实也一直在寻求其中的平衡点。
赵文婷:确实是在银行业务开展过程中会碰到很多不同模态、不同结构的数据,比如说前面提到的产品合同、债券、票据,它们主要是文本图像数据。除此之外,比如在理财产品售卖、双录等环节,还会有很多录音录像等数据。为了解决这个问题,我们对审核系统中进行了逐步拆解,搭建了多层结构:
数据层:数据层我们打通了语音、文本、图像等不同模态不同结构的数据,通过 es、kafka、ecs、mysql、redis 等不同方式将审核中台与业务系统数据打通。
能力层:能力层我们整合了 ASR、OCR、声纹、人脸、知识图谱等多种 AI 算法能力,通过语音、图像、信息抽取能力将数据标准化入库,依据不同业务场景搭建审核模型。
平台层:在审核模型生成后,通过平台方式进行审核能力整体输出,按不同时效性将进行 T+0、T+1 数据审核。同时平台层进行审核知识、审核逻辑管理、数据回流等操作,保障数据完整闭环。
渠道层:最终不同类型数据在不同渠道分类展示,各个场景分别赋能。
赵文婷:不同场景技术组合逻辑会有差异。
以票据审核为例,应用较多的模式是首先通过语音识别、图像处理比如 OCR 做智能识别,将多模态数据做智能录入,然后针对录入信息进行自然语言处理,包含结构化信息抽取,比如身份证号、银行卡号、姓名等,最后按不同场景要求做不同模态内容合规审查,比如文本上的要素一致性、完备性,图像上的核身准确性、证件完整性等。
再比如,电访这样的营销场景可能会先针对电话录音文件通过 ASR 将语音转成文字,然后再进行自然语言处理。换句话说,这些技术的组合策略实际上是根据业务导向和业务场景数据类型去决策的。
赵文婷:比较深刻的挑战应该是在做具体的一个产品合同审查场景,场景特点是合同非标准化、表述差异大,涉及内外规知识较多,审核逻辑复杂,历史审核意见形式多样。它对审核人员对专业性要求非常高,但专业审核人员对培养需要非常长的时间周期。
虽然通过对高质量数据的标注和学习,进行 AI 建模可以在一定程度上解决这个问题,但是我们发现人工写的东西跟机器能读入学习的形式还有巨大差异。基于上述问题就带来了审核模型既往能力复用性不强,场景可用标准数据少,审核知识库梳理难度大的问题。
为此,我们的办法是先把场景缩小。以产品合同审核为例,针对合同多样性问题,我们缩小一期审核类型,优先聚焦审核标准相对统一、数据量大、合同样式较简单的场景,一期快速推进上线,经过线上验证后收集反馈数据优化模型迭代同时扩展审核范围,精益模式不断优化,逐步降低一线审核压力。
另外,针对没有太多标注样本的问题,我们也通过对历史审核数据聚类挖掘 + 人工复核梳理高频审核点,辅助业务人员进行审核知识拆解。
赵文婷:我觉得近期大模型的快速发展为审核系统未来升级带来了新的想象空间。尤其是大模型语义理解能力,推理能力的提升,相对传统模式有了更多探索可能性。
因为专业审核工作领域知识积累要求是比较高的,现有审核系统搭建很依赖专家知识库梳理,对审核人员的要求比较高。同时受限于场景数据量及审核点复杂性,目前复杂审核点审核准确率待提升。比如现在针对复杂审核点,更多的方法是将复杂问题简单化,拆解为审核逻辑明确的多个小审核点通过要素推理、审核模型训练方式处理。
但目前的方式还是有一些复杂语义问题很难解决,比如像销售环节要求从业人员不能夸大销售、虚假营销,如果是明确审核点比如说不能承诺可以保本、无风险这样很好训练单点审核模型,但提到不能夸大销售,这就比较抽象,现有模型很难理解,但大模型在类似问题上表现出了很好的效果,希望未来可以发挥大模型能力进一步优化。
赵文婷 硕士毕业于北京航空航天大学计算机系,加入招行人工智能实验室后,长期从事语音语义理解相关算法模型研发落地工作。先后主导推进智能合同审查、智能语音质检、智能双录、智能外呼、智能协呼语义理解及 TTS 应用建设等项目,深耕自然语言处理、语音合成、声纹识别、多模态分析等技术能力。项目期间参与发表论文被 EMNLP、ACL、IEEEE Trans 等国际顶会顶刊录取,所参与团队知识工程建设相关项目曾获银保监会一等奖、人民银行二等奖,同时先后获得招行中心级年度优秀员工、年度 MVP、优秀导师等多项奖项。所推进相关技术广泛应用于招行客服、经营、风控等核心业务场景,持续推进最前沿人工智能技术在金融领域结合落地。
首届 FCon 全球金融科技大会将于 11 月 19-20 日在上海举办。本次大会已邀请到工商银行、招商银行、汇丰银行、兴业银行、中信银行、北京银行、平安人寿、度小满、蚂蚁集团等业界知名银行以及金融机构的大咖,前来分享大模型、 Web 3.0 、隐私计算、数字货币、区块链等前沿技术在金融领域的落地案例。
我们诚挚地邀请您加入我们,共同探索金融科技的未来。
扫码或点击「阅读原文」即可查看全部演讲专题。
目前是 9 折特惠购票,报名立减 ¥680,咨询购票可联系:17310043226(微信同手机号)
微信扫码关注该文公众号作者