探索大模型智能:众安保险基于 AIGC 的应用实践
每一次技术浪潮的兴起,或多或少都会对各行各业产生深远的影响,并带来突破和进步的机会。此时行业中总有一些敏锐的从业者会及时抓住机遇,积极采用新技术,优化业务流程,改进产品和服务,从而获得更大的竞争优势。
众安保险,是当下 AIGC ( AI-generated Content,人工智能生成内容)浪潮里其中一个敏锐的先行者,它自 2022 年开始调研 ChatGPT 并探索 AIGC 在自身业务的落地应用。
“随着 AIGC 浪潮的兴起,我们认为,协作智能将成为数字化向智能化转型的科学前沿。而在这个趋势下,特别是金融保险这类数据密集、并且直接服务于人的行业,将迎来快速突破和进展。”众安保险 CTO 蒋纪匀近日接受 InfoQ 采访时如是说。
作为互联网保险公司,众安保险一直都侧重于通过科技手段打破传统保险业的行业壁垒。据了解,目前众安保险已将 AIGC 技术应用到内部多个流程环节中,尤其在营销服务场景, AIGC 已经做到能够辅助众安保险的员工快速生成各类营销素材、加速产品上线,比如制作文案内容、视觉设计、优化推文效果等等。
其中,在制作文案内容方面,员工可以利用 AIGC 工具生成符合品牌形象和市场趋势的文案、标题、描述、标语等内容,提高广告文案的工作效率,并快速批量生成科普类文章。
视觉设计方面,通过 AIGC 相关的工具和平台,能够快速生成符合品牌形象和市场趋势的视觉设计元素,大幅提升了营销素材的设计效率。比如,以前需要三天才能完成的产品海报图,现在只需两三个小时就能生成多套不同风格的图片。此外,在直播背景墙、活动营销图片、图标、动画等多个场景中,员工都可以迅速应用 AIGC 工具为营销的各个环节赋能,加快产品和活动的上线速度。
与此同时,众安保险还可以利用 AIGC 的文本数据分析能力优化营销内容,根据社交媒体平台的数据分析,优化现有的营销内容,生成更具吸引力的推文标题、内容和标签,以提高推文的点击率和曝光率。
此外,除了内容生成相关的能力,AIGC 还被应用在智能客服领域,充当辅助助手的角色。当坐席与用户沟通的时候,它可以帮助坐席自动生成回答,并在通话结束后自动生成会话总结,根据场景和语义提取新线索。
据了解,众安保险一直都有配智能客服服务,但传统智能客服是基于自然语言处理(NLP)技术,如今团队则基于 LLM 开发了新的智能客服,并通过 AB 测试发现新的智能客服在准确率方面提高了 25%,实现了更高级别的智能化。
“这些应用都取得了积极的效果,并得到各业务部门的肯定和积极反馈。”蒋纪匀表示,目前众安保险内部的业务人员对数据 AI 模型的认知不断提升,许多人都积极学习 AI 技术,包括 AIGC 的使用,“技术和业务团队之间开始展现双向奔赴的趋势”。
当我们使用像 ChatGPT 或 Midjourney 这类 AIGC 应用时,可能会觉得这很简单,就像雇了一个数字员工。然而,在垂直行业里的实际应用情况并没有宣传片中看起来那么简单。
面对 AIGC 的应用,不同公司会采取不同策略,比如自建大模型、fine-tuning(微调)和 embedding(嵌入)等,每种方式都有其优缺点。众安保险认为,中小型保险公司采用 embedding 是较为合适的路径,因为自建大模型需要大量的数据、资源和人力来标注,这对普通公司来说是难以承载的。此外,数据的合法性和合规性也是一个核心问题,尤其对于像保险公司这样的金融机构来说,客户数据的安全和隐私不可忽视,因此不可以拿客户数据来训练。
此外,由于 ChatGPT 3.5 已经无法很好地支持 fine-tuning,所以众安保险最终选择基于 embedding 的思路打造了自己的 AIGC 中台——灵犀,为企业提供了一套 AIGC 应用场景研发落地的标准范式,其 embedding 能力主要基于一站式文本嵌入、知识库切片的复杂性屏蔽,以及知识库向量化复杂度的屏蔽等。
蒋纪匀指出,将 AIGC 应用于保险业务场景的过程中还面临着一些比较大的挑战。
首先,众安保险团队需要根据 AIGC 场景下的最佳实践进行产品化,并进行内部调优和提升。
对此,蒋纪匀进一步解释称,虽然 AIGC 在处理自然语言和逻辑推理方面非常强大,但若面对一些感性或过于复杂难以理解的问题,它可能无法给出准确的答案。这也是通用人工智能的一个比较显著的问题。
因此,团队首先需要对复杂问题进行理解和抽象,将其简化为大模型可以解决的问题。在这个过程中,众安保险团队进行了很多适应不同场景的提示工程和知识库的开发。这些提示工程和知识库的目的是帮助用户更好地使用 AIGC ,而不是仅依赖通用化的人工智能来解决问题。
对于上述挑战,蒋纪匀分享了一些实践经验。一方面,始终坚持以价值为导向,寻找 AIGC 在落地应用中的价值点。
“将 AIGC 应用到实际业务中是为了增加业务价值,而不是为了验证技术的可行性。”其指出,很多时候,我们可能会陷入一种误区,就是认为任何问题都可以通过 AIGC 来解决。然而,最核心的问题其实是要判断某个问题是否适合使用 AIGC 来解决。
而在此判断过程中,需要进行价值增量的分析和推演,判断是否简化了原有流程、提升了用户体验、增加了整体吞吐量,以及对业务价值和成本降低的贡献。如果最终答案不能令人满意,那就不应该在这个点上投入资源。
其次,要意识到对话是一种选项,但不是唯一的选项。虽然在使用 AIGC 时,默认的交互方式是对话,许多人认为只要不断与之对话并细化需求,最终问题就能得到解决。然而,在实际应用中,提示工程对微小变化非常敏感,而对大多数用户来说,掌握这些技巧并不容易。
因此,如果仅仅以对话的方式供用户使用,效率并不高。因此,众安保险的工程团队需要不断积累针对具体问题的提示工程,让终端用户无需重复输入;同时,设计一些图形化的用户界面,隐藏背后的复杂性,让业务人员专注于他们擅长的领域,而不必关注繁琐的工程问题。
简言之,众安保险主要通过封装和提示工程来聚焦和优化 AIGC 的回答,使其更加高效和专注于解决问题,而不会“胡言乱语”。
除了针对特定场景定制化应用,AIGC 的另一大落地难点在于敏感信息的安全性。
蒋纪匀提到,应用 AIGC 难免涉及到大量的数据和训练模型。由于在 ChatGPT 3.5 及以上版本中无法进行调优式训练,因此通常采用提示工程与 ChatGPT 进行交互。在提示工程中,需要向 AIGC 的供应商提供问题和一些上下文信息。然而,这种情况存在数据隐私泄露的风险。
为了解决这个问题,众安保险需要建立相应的数据安全保障机制。首先,如果直接让每个人直接调用 AIGC ,肯定会出现各种问题,因此众安保险在平台架构层面采取了一些封装措施,使其输入和输出更可控。
灵犀的产品架构划分为模型即服务层(MaaS 层)、大模型应用框架层和平台层,通过不同的分层能力为企业内部提供基础的模型服务和开发能力。而通过这样的封装,他们在输入和输出端便实现了安全可控的拦截机制。
平台能力方面,蒋纪匀首先介绍了审计能力,对于大模型服务的使用,他们需要审计用户输入的合理性以及模型服务的输出的合理性,这是在 AIGC 服务网关中必须具备的功能。如此一来,当发生风险事件时,可以根据审计日志进行追溯,这也有助于规范用户对 AIGC 相关应用的使用。
其次,敏感信息的检测和脱敏也是核心举措之一。为了应对敏感信息泄露的挑战,众安保险采用了正则表达式和敏感词知识库两种方式进行敏感词检测,以拒绝非法的输入和输出。这有效地规避了政治敏感、数据敏感和用户敏感信息泄漏等事件的发生。
第三,API 的安全性。众安保险要求所有的大模型服务 API 都必须进行身份验证和健全,无论是用户调用还是应用程序调用,以确保用户使用的合法性和可追溯性。
谈及众安保险如何保持对技术的敏锐度和关注,蒋纪匀指出,保险行业一直注重数据分析和运用,但该行业过去主要使用老旧的机器学习范式,整体模型是分散的,并且需要从零开始构建,导致效率相对较低。
尽管一些头部的保险公司逐步采用机器学习平台和特征工程化平台等方法来降低模型研发成本,但基于这种范式的效率仍然偏低,限制了模型的发展潜力。
于众安保险而言,从 2010 年开始,其采用了文本加结构化数据的多模态模型的方式,显著提高了健康险理赔风控模型的性能。从 2022 年开始,众安保险还基于 Transformer 结构的用户行为序列模型,在头部互联网媒体的实时广告投放筛选模型中取得了传统模型无法达到的水平,并简化了在海量稀疏特征场景下的特征工程开发。
“这些都是采用新的模型策略来应对技术发展速度变化、并在尝试过程中取得的进步。”蒋纪匀感慨道。
他亦再次强调场景驱动的重要性,“不能因为现在有了 AIGC 就认为所有场景都可以用 AIGC 解决,需要判断它是否适合。”
不同的模型在不同场景有各自的优势,企业可以通过对大模型的调优,或者提示工程来满足定制化需求。而一旦找到合适的场景,如何实施则因企业而异,这也是企业未来最重要的核心竞争力。
对于众安保险而言,目前他们在 AIGC 方面的应用和服务还没有对外销售或提供,仍处于自我探索阶段,需要持续研究如何更好地应用 AIGC 技术。
短期内,众安保险计划在智能营销、保险核心业务系统、研发运维一体化平台和数据产品等方面应用 AIGC。从中长期来看,众安保险将继续基于 AI 和 AIGC 构建具有差异化的核心竞争力。“只有具备差异化的核心竞争力,公司才能在国内竞争激烈的保险行业中脱颖而出。”
据悉,未来,众安保险还可能会孵化一些产品,并将这些成果输出到保险行业中。在众安保险看来,AIGC 的普及将缩小中小型保险公司与大型保险公司在 AI 技术能力方面的差距,同时也为中小型保险公司提供了“弯道超车”的机会。
你也「在看」吗? 👇
微信扫码关注该文公众号作者