知识图谱技术在信贷领域的应用
当前,金融业正经历从“互联网 +”到“智能 +”的跃变,催化银行信息服务向智能化方向发展。知识图谱技术作为人工智能领域的重要研究方向,在信贷、普惠等业务领域的海量数据挖掘与关联分析有良好的应用前景。中国工商银行软件开发中心(以下简称“工行软开中心”)整合行内外数据与信息,运用知识图谱技术打造面向信贷全流程的数据处理与知识挖掘服务,提升信贷运营精细化、智能化水平,为银行风险防控、营销拓客等业务提供决策支持,助力银行在信贷领域达成战略目标。
信贷流程中存在客户数据维度多、分散且依赖人工收集,信息检索自动化程度和智能化能力不足,深度的数据与信息分析依靠专家经验,无法普及,影响整体的信贷风险决策水平。针对上述问题,工行软开中心在信贷领域引入知识图谱技术,通过整合客户风险交易数据、客户关联关系等数据,构建客户风险图谱与客户关系图谱,取得以下两方面业务成效:
1、降低信贷风险:通过对借款人的社交关系、资金流水、财务状况等多维度信息的分析,利用知识图谱技术构建风险控制模型,自动识别信贷流程中的欺诈行为、高风险交易等异常情况,降低信贷全流程风险。
2、提高营销获客效率:运用知识图谱图关联分析算法,在海量数据中挖掘潜在营销客户,结合客户画像数据,精准输出价值客户清单,极大减少人工营销过程,为业务获客活客黏客提供便捷。本文实践过程分为知识图谱能力建设与信贷领域知识挖掘两大步骤,其中知识图谱能力建设为信贷领域知识挖掘的前置条件,通过打造标准化知识图谱能力,构建流水线式的图谱应用,帮助高效快速地进行场景化知识挖掘。而信贷领域知识挖掘包含风险防控与精准营销两大场景应用,本文重点阐述其实现路径与算法挖掘过程。
知识图谱是一种语义网络,它以图的形式描述客观世界中的实体及其关联关系,以更贴近人类认知的视角将信息对外表达。通过知识图谱,我们可以从海量的非结构化数据中快速精准地提取价值信息,帮助我们更好地理解数据背后的逻辑与业务模式。
工欲善其事必先利其器,工行软开中心打造了标准化流程的知识图谱构建能力,包含数据加工提取、知识抽取映射、图谱查询推理三大步骤,赋能研发人员快速构建信贷领域场景化图谱应用。其中数据加工提取是数据采集、整合、加工的过程,需要从多个数据源采集相关数据,包括但不限于内部积累的业务数据、授权公开的征信数据、以及业务关系中分析出的社交属性数据等,通过标准化数据入湖操作后,为图谱分析需要的原始湖表数据提供前置条件。
知识抽取映射是知识图谱构建的核心步骤,将结构化、非结构化数据文件加工转换为图结构所需要的实体、关系文件,并将图 Schema 与实体关系文件进行映射的过程,其基本组成单元是“实体 - 属性 - 实体”三元组,实体间通过关系相互联结,构成网状的知识结构。
图谱查询推理是基于构建好的知识图谱,通过查询语言(如 Gremlin)可以查询特定实体的属性、关系以及实体间的关联信息。利用丰富的图算法实现知识推理与知识挖掘,包含基础图分析算法如社区发现、标签传播、PageRank、环路识别等,以及图神经网络算法如 GCN(图卷积神经网络)、GAT(图注意力网络)等;基于图神经网络的强大模式识别能力,分析借款人的社交网络、交易网络、信用网络等,有效识别潜在欺诈团伙或高风险客群;同时分析客户的消费行为、偏好或需求,挖掘潜在价值客户,提供个性化的产品服务。
工行软开中心基于标准化的知识图谱服务能力,结合信贷全流程场景,打造面向信贷全流程的数据处理与知识挖掘服务。以风控领域知识挖掘为例,通过整合客户事实数据,从风险源认定、定量定性衡量、传播路径、输出服务四步骤,构建信贷领域风险知识全景视图。
在降低信贷风险方面,工行软开中心整合客户资金交易、票据背书、担保抵押、融资行为等数据,从资金饥渴风险、贷款资金归集风险、虚增流水风险 3 方面构建图谱模型。利用卷积图神经网络算法、egonet 算法,生成客户图谱风险因子,并将风险因子反馈至风险客户图谱。利用知识图谱社区发现、标签传播、环路识别算法,在征信报告未体现的小贷、消金业务中,挖掘出客户与融资机构的频繁融资、高额借贷等行为。快速识别风险交易链条,找出涉诈涉黑用户,并生成客户预警清单,在贷前、贷中、贷后提供决策预警,为客户经理实施授信冻结、贷款追回等风险缓释措施提供有力支撑。
在提高营销获客效率方面,工行软开中心整合行内外企业工商关系、股东关系、投资关系、押品关系、合同关系、票据背书关系、资金关系、自然人关系等大规模复杂关系网络,构建企业信贷领域关系图谱。在深层次隐性关联关系挖掘过程中,利用知识图谱 PageRank、K 层扩展、最短路径等图算法,支持企业多维度数据穿透式分析与关系探查,输出重要关联企业到目标企业的最短营销路径,自动生成潜客营销清单,为企业客户的管理和洞察提供有效数据支撑。同时在企业关系图谱服务端,抽象出配置化的探查服务能力,用户可以自主定义新接入的关系模型,完成实体 - 属性 - 边的配置,敏捷化上线新的企业关联探查服务,快速响应业务精准化营销的需求。
此外工行软开中心积极探索与建设产业链图谱,融合产业链上下游企业工商信息、信用信息、财报信息、担保信息、舆情信息、行情信息等;基于产业链的上中下游各个环节、对应的企业、地域分布等情况,结合企业评分、产品与公司关联度、产业布局深度等对企业进行分层,通过产业链图谱筛选优质企业,助力行内潜客挖掘营销。
知识图谱技术在银行信贷领域的应用具有重要的意义,通过应用知识图谱,银行可以更加全面、准确地评估借款人的信用状况和风险水平,提高信贷评估的准确性和效率。未来,工行软开中心将探索大模型与知识图谱融合,利用大模型强大的语义分析和理解能力,替换图谱构建中人工成本较高的实体挖掘、关系抽取等步骤。随着技术的不断进步,知识图谱将在银行信贷领域发挥更大的作用,推动金融行业的持续创新和发展。
大模型技术正在引领行业发展创新浪潮。那么,如何让大模型技术与行业深度融合?如何通过大模型技术为各行各业提供更加智能化的解决方案?在金融、法律、医疗、教育、政府等各行业的实践场景中,又有哪些大模型落地经验?「AI 前线」特别为您精选了刚刚结束的 AICon 全球人工智能开发与应用大会上的精彩演讲,并经过嘉宾授权将演讲的精彩 PPT 提供给大家。关注「AI 前线」,回复关键词「行业创新」即可免费获取。
本届 ArchSummit 会议上,重点聚焦 AI 大模型技术在各行业的落地实践, 顺丰集团、众安银行、天弘基金、鸿海科技集团、宁德核电、广发证券、微众银行介绍大模型技术的应用效果 。会议上还设置了大模型应用、架构升级、智算平台、AI 编程、成本优化等专题和话题内容。扫下图二维码查看更多详情。购买票数越多,享受的优惠也就越丰厚,可以联系票务经理 17310043226 , 锁定最新优惠。
今日荐文
这个离开大厂去 AI 创业的互联网大佬,带着他的“Killer Agent”来了
都白学了!Mistral 的首个“开放”编程模型,精通Python、C等 80+ 语言,用220 亿参数赢了 GPT-4
奥特曼突然变身OpenAI “安全卫士”!网友:刚被实锤不关心安全还“心理虐待”,谁信啊
禁令再升级!拜登政府已不想让中国人在美从事AI工作了,套壳大模型的公司也危险了
老黄急了!为跟华为抢业务,英伟达也得低头降价,但大家已经不买账了?
你也「在看」吗?👇
微信扫码关注该文公众号作者