直奔价值创造,蚂蚁发布金融大模型及应用公众号新闻2023-09-09 03:099月8日,在上海举行的外滩大会上,蚂蚁集团正式发布了蚂蚁金融大模型。聚焦金融场景的“研判观点提取”“金融意图理解”“金融事件推理”能力在两款产品上得到应用,分别是面向消费者的智能金融助理“支小宝2.0”和服务金融产业专家的智能业务助手“支小助”,这也展示了蚂蚁在大模型领域从技术到产业应用的全面进展。蚂蚁金融大模型强调的是务实和为业务创造价值,也历经了颇为辛苦的准备期。“三、四月份的时候,我们跟大家一样,觉得大模型发展速度太快了,有各种各样的可能性。”蚂蚁集团副总裁、蚂蚁金融大模型负责人王晓航说。其实蚂蚁在2021年就已经关注到了大模型,并预感到预训练+精调的方式可能会带来一场生产范式的变革。目前,基于蚂蚁基础大模型,针对金融产业深度定制的蚂蚁金融大模型已在蚂蚁集团的财富、保险产品上展开内测。蚂蚁大模型:百舸争流,厚积薄发从发布时间来看,蚂蚁的速度确实不是最快的。5月,度小满正式发布了千亿级中文对话大模型轩辕,以中文、金融、开源为特色,构建了千亿tokens的中文预训练数据集。6月,恒生电子旗下的恒生聚源正式发布了金融行业大模型Light GPT,使用了超4000亿tokens的金融领域数据和超过400亿tokens的语种强化数据,支持超过80+金融专属任务指令微调。甚至包括后发的华为盘古大模型、腾讯的行业大模型等厂商,都会把金融业场景列为一个重要的行业应用方向。复旦大学教授、上海市数据科学重点实验室主任肖仰华认为,大模型的能力和人的教育很相似,都需要先培养通用认知的能力,再去培养特定领域的专业力。通用大模型一定是行业大模型发展的底座,但金融行业是典型的复杂决策行业,单单停留在通用大模型是不够的,仍然有漫长的领域适配和行业优化的路要走。这一轮大模型赋能行业的本质,根本目标就是实现智能化的专家水平的行业智能化。蚂蚁集团表现出了极大的耐心,在有规模化产品应用落地的时候,才发布金融大模型。蚂蚁集团首席技术官、平台技术事业群总裁何征宇认为:“金融有专业性和逻辑的严谨性,以及严苛的合规要求,这是金融大模型要解决的专业问题。”除了专业力的缺失,金融大模型还需要解决原生的幻觉问题、可控性问题和可解释性问题。因为金融行业对数据和信息的要求极其精准,容错率极低,一旦出错可能就是巨大损失。攻克金融大模型的“四力”难题肖仰华认为,“金融大模型把能力分成了三件事:底座模型的能力吸收学的是知识;指令微调阶段学的是解决任务的能力;对齐阶段学的是价值的对齐,把整个的智能分解成了知识、能力和价值三个方面。”这与王晓航的观点不谋而合:“金融大模型实现落地行业是一个复杂化的系统工程,需要将金融领域的语言力、专业力、知识力以及可控生成能力(安全力)的‘四力’形成合力。”蚂蚁金融大模型在这四个方面下了不少工夫。知识力和语言力上,蚂蚁金融大模型除了在万亿量级Token的通用语料基础上,注入了千亿量级Token金融知识,还从300+真实产业场景中提取了共60万+高质量指令数据,形成了金融专属任务性能优化的优势数据资产。专业力上,得益于蚂蚁长达十年的积累,平台上有完备的数字化金融工具矩阵,蚂蚁金融大模型可通过理解用户语言,精准调用蚂蚁体系内的这些专业工具,给用户提供相应专业服务,理财侧包括金融选品、产品评测、行情解读、资产配置等6大类服务,保险侧包括产品解读、家庭配置、智能核保、智能理赔等10多个智能服务。安全力或者说可控生成力,主要针对内容生成的幻觉和安全性问题。蚂蚁金融大模型采用意图识别与事实性校验相结合的方式,大幅提升了生成内容的合规性、安全性和真实性,在金融领域实现了行业领先的可信围栏技术。整合这几种能力离不开工程服务能力。“蚂蚁大模型走纯自研的技术路线,以全栈布局、长线发展为原则,以创造产业价值为目标。为此,蚂蚁坚决投入大模型底层基础设施,目前已建成万卡AI集群,训练效率领先行业,为大模型落地应用提供有力支撑。”何征宇说。据介绍,蚂蚁具备万卡AI集群,千卡规模训练MFU可达到40%,集群有效训练时长占比90%以上,RLHF训练在同等模型效果下训练吞吐性能相较于业界方案提升3.59倍,百亿参数模型推理性能相较于业界方案提升约2倍,处于业界先进水平。一流的基础大模型能力,给蚂蚁金融大模型提供了很好的基础和起点。此次,蚂蚁也开放了金融专属任务评测集“Fin-Eval”,填补了高质量综合性评测集的行业空缺,为行业的发展做出贡献。“蚂蚁集团在计算、存储、安全等根技术领域的积累,为人工智能大规模落地产业释放数字价值提供了有力的技术支撑,共同推动了蚂蚁人工智能在金融、民生、可持续发展领域的大规模应用。”蚂蚁集团副总裁、人工智能首席科学家王志荣说。应用落地:支小宝+支小助蚂蚁稳扎稳打地发布了蚂蚁金融大模型和支小宝2.0、支小助,虽然两者还在内测,要等备案工作完成后才能上线,但从目前披露的信息来看,蚂蚁大模型及其应用落地的进展在行业内是较为领先的。做出理想的金融小助手,是近些年来金融IT圈想要攻克的难题。“之前我们投入了几十号人力,去写机器能理解的规则,前后大约十年做了一套系统,整体准确率做到了90%,但是长尾问题要花非常长的时间解决。”一位金融IT人士这样吐槽。这种“剧本式机器人”需要投入大量人力写出相关规则进行约束,为了补充新的知识,常规深度模型训练也要耗费大量的成本,而且使用时还要考虑线上服务的耗时问题。采用大模型也已经纳入了他的考量,“我们采用了一些新的模型,效果有显著好转。”他说。接入了蚂蚁金融大模型技术的智能金融助理支小宝2.0,率先实现了从“检索式AI”到“生成式AI”的跃升。据透露,“支小宝2.0”的金融意图识别准确率达到95%,金融资讯总结和事件推理水平已经达到了行业专家平均水平。无论是产品评测、收益分析、要不要加减仓、解读行情,或者是咨询资产配置方案,选择保险,都可以通过向支小宝2.0提问来获得参考答案。另一个智能业务助理“支小助”,则是一个真人专家一样的“打工人”,被认为可能引发金融机构从业人员生产模式和生产力变革。“支小助1.0”包含了“服务专家版”、“投研专家版”、“理赔专家版”、“保险研究专家版”等六个版本,可在投研分析、信息提取、专业创作、商机洞察、金融工具使用等环节,为理财师、保险代理人等从业人员提供深度智能服务。以医疗险理赔为例,用户平均要提交11张医疗单据,基于海量图文预训练的多模态大模型可将复杂单据的整案提取准确率由80%提升至98%。“理赔支小助”让门诊险理赔和30%以上的住院医疗险理赔,能够完全自动化,而且这个比例还在快速提高,为保司降本增效。王晓航表示,蚂蚁做大模型的思路是规模化落地产业应用,解决产业真命题。金融产业的关键职能,都值得用大模型重新设计。据了解,支小宝和支小助在完成备案工作后,会正式向蚂蚁平台上的合作机构开放,助力金融机构数字化、智能化升级。微信扫码关注该文公众号作者戳这里提交新闻线索和高质量文章给我们。来源: qq点击查看作者最近其他文章