中关村科金张杰:未来三至五年,对话式AI在ToB赛道充满机遇|超级观点公众号新闻2023-01-05 13:012022年末,ChatGPT引爆科技圈。封面来源|视觉中国2022年末,ChatGPT引爆科技圈。这个由OpenAI开发的聊天机器人一经推出,便因强大的对话能力惊艳四座。“这是一个‘量变引起质变’的产品,也一定会再次唤起公众与资本对‘对话式AI’的认知。”国内头部对话式AI技术解决方案提供商中关村科金技术副总裁张杰对36氪表示。中关村科金创立于2014年,主要提供基于对话式AI的数字化营销、运营、服务解决方案,服务客户覆盖金融、零售、政务等行业。中关村科金所处的对话式AI赛道,是AI行业最受关注的细分赛道之一。在技术难度上,对话式AI最核心的NLP(自然语言处理)技术,一直被誉为“AI皇冠上的明珠”。在AI技术诞生前,一个能像人类一样对话的“虚拟人”就一直存在于哲学家与小说作家的梦想之中;而AI技术出现后,现在的我们比任何时刻都更接近这一梦想。在市场潜力上,对话式AI也不可小觑。根据利文联合头豹研究院发布的《人工智能系列报告:2021年中国对话式AI市场报告》,2021年,中国对话式AI市场规模为82.7亿元,到2026年,这一数字有望增长至265.8亿元,年复合增长率高达26.3%。在公众熟知的消费级市场,从手机、家电到汽车,越来越多的智能设备开始支持语音互动。随着AIoT及5G技术的不断成熟,这一趋势将更加明显。而在更具商业潜力的企业级市场,根据《人工智能系列报告:2021年中国对话式AI市场报告》,金融业是对话式AI渗透率最高的行业赛道之一。特别是在智能客服领域,智能客服头部厂商在金融领域的渗透率为100%,其他渗透率较高的细分市场则分别为电商、旅游、政务、传媒等。自成立以来,中关村科金一直致力于通过人工智能、实时音视频、大数据等智能科技创新及深度应用驱动泛行业数字化转型。近年来,中关村科金开始积极布局政务、零售、医疗、汽车、智能制造等新市场。在张杰看来,随着各行各业数字化程度的不断加深,对话式AI在企业级市场的渗透率也将不断提升。未来,我们可以在线下看到更多的“数字营业厅”,数字人也将把人类从一部分繁琐工作中解放出来。以下为中关村科金技术副总裁张杰采访实录,36氪略经编辑:36氪:2022年即将过去,中关村科金的业务取得了哪些新突破、新进展?张杰:过去一年,中关村科金的进展主要分三方面:市场拓展、产品化能力打造以及硬核技术的沉淀。在行业拓展方面,中关村科金一方面在金融领域稳步拓展,稳固公司的“粮仓”。与此同时,我们也成立了新的事业部,开拓政务、医疗、零售、汽车等行业客户。在过去一年,政务、零售等新领域的客户拓展速度很快。在政务服务方面,中关村科金已和几个省市的公安部门达成合作,提供智能反欺诈预警宣传解决方案,通过人机协同高效率实施反诈劝阻,强化反诈预警和宣传能力。在零售、医疗行业为物美、百安居、欧派家居、步步高、捷安特、北京朝阳医院、广东省中医院、爱康国宾等医疗机构提供服务,也为包括像新氧、喜马拉雅等互联网公司提供数字化解决方案,建立智能化服务能力。产品化方面,中关村科金今年进行了内部调整,坚定不移地推动产品化,提升标准化程度,并降低交付成本。目前,我们沉淀了四大类型的产品——智能营销、智能运营、智能分析、智慧能效,形成一套共用公共组件层。在硬核科技方面,中关村科金组建了人工智能研究院,团队规模超 300 余人,核心成员由清华、北大、中科院博士组成,自有AI技术实现完全自主知识产权。作为企业服务赛道上的AI公司,我们坚信核心竞争力一定来源于底层的硬核科技,为此我们构建自主知识产权的对话引擎,并且从底层AI能力到共用组件,再到产品层均进行了信创认证。36氪:作为一家AI企业,我们看到中关村科金有丰富的泛行业数字化服务积淀。为什么选择金融领域作为AI产品落地的第一选择?张杰:中关村科金的定位是通过对话式AI技术赋能千行百业的数字化转型。数字化是各个行业都会面临的问题。最初选择金融赛道的原因是,与其它行业相比,金融机构的数据基础更好,对于数字化转型的需求也更明确,智能化手段带来的商业价值更明显。也正因如此,很多AI企业都将金融客户作为重点客户。中关村科金积累了很多风控、营销、反欺诈等场景下的经验和技术,我们既有咨询能力、又有工具支持、还有建模能力。36氪:我们注意到,中关村科金目前的产品及解决方案已不仅仅局限于金融领域。从金融到政务、零售、保险、医疗等领域,中关村科金的哪些能力是可以复用的?哪些能力是需要跨界学习的?张杰:首先,我们可以拆解一下中关村科金的能力,然后再看哪些能力是可以复用的。如果把这些能力看作是一层层的洋葱,最内部的核心是对话式AI技术,中间是产品层,最外层是解决方案。最核心的AI技术,包括语音识别、语音合成、数字人、自动问答等等,这些核心层的能力,都是可以复用的。中间的产品层,主要围绕各种对话场景,我们拆解出了很多产品,例如外呼营销、客服系统、陪练质检、坐席助手等等,这些能力也是可以复用的。最外层的解决方案则相对复杂,有一部分是可以跨行业复用的,一部分可以在行业内通用的,还有一些则需要定制化开发,相对较难复用。比如在外呼营销、质检等场景下,不同行业面临的客群的心理特征是相似的、对话时表达情绪和态度的词是相似的,这部分跨行业的内容也是可以跨界学习的。也正因如此,中关村科金可以将企服对话场景下的先发优势转化成数据资源优势。36氪:最近ChatGPT火遍科技圈,从技术角度上,您如何看待ChatGPT目前的能力?ChatGPT的火爆是否会加深资本市场/公众对于对话式AI的认知?张杰:试用ChatGPT后,直观感受真的是非常震惊,这是一个“量变引起质变”的产品。ChatGPT是在GPT-3.5之上通过“基于人工反馈的强化学习方法”(RLHF)做出了令人震撼的效果,这个方向之前并不是学术界的主流模式,但OpenAI团队坚持了这个方向,取得了跨越式的成果。未来,无论是学术界还是产业界,都会有更多资源投入到这个方向。同时,这也为GPT-4的推出吊足了大家的胃口。对于公众与资本市场,ChatGPT一定会强化他们的认知,就像当年的AlphaGo一样。但对于我们产业界而言,不能仅仅把ChatGPT当作一个小玩具,更值得思考的是如何将这样的产品商用化,带来更多商业价值。36氪:在对话式AI领域,厂商的技术能力可以被拆解为哪些维度?张杰:按照处理流程,我们一般会将其拆解为4个模块。首先是了解客户的需求,涉及到算法能力与工程系统,对接客户的CRM等系统,通过算法识别对话客户的情绪与意图,例如,保险领域的客户,我们要了解客户是想咨询产品、理赔还是投诉。其二,是在了解需求的基础上,建立专业领域的知识库,同样需要算法与工程两方面的能力。在工程上,需要对接客户的业务系统,对服务流程、交易规则等有清晰的认知;在算法方面,要从业务系统的日志中、各类文档中,抽取出知识片段,把零散的知识结构化,建立技能类知识的流程图和事实类知识的知识图谱。其三,是决策能力,也是对话式AI的核心,基于对客户的了解、对领域知识的了解,知道用什么样的策略对话,这需要综合考虑经营策略、客户情绪等等。系统要能够从日志中持续挖掘学习出最佳策略,必要时以人机协同的方式引入业务专家参与话轮设计。最后,是交互产品的设计。例如,在人工坐席的对话系统内,我们可以在侧边栏给出AI推荐的回复,提升人工客服的工作效率。或是通过语音合成、表情合成等技术,提升数字人的交互体验。36氪:我们注意到,中关村科金的对话式AI解决方案中,有多款产品都运用了多模态交互技术。在多模态领域,中关村科金的技术积累如何?张杰:多模态方面,中关村科金在国际深度伪造大赛FF++中以综合准确率94.1%斩获冠军,在国际声纹顶级赛事VoxSRC中,中关村科金以识别率99.7%的成绩获得双赛道亚军。今年我们也在不断申请多模态相关的软件著作权与发明专利超过100多项。在具体的产品方面,中关村科金的多模态技术在远程银行、数字营业厅、员工陪练等场景下都有落地应用。比如我们给邮储银行重庆分行线下智慧网厅打造的数字人员工“小邮”, 搭载图像识别、语音识别与合成、语义理解、人像建模等AI技术,具有较强的认知与表达能力,以智慧大屏等设备为载体,提供业务办理咨询服务、金融产品营销服务等,实现多模态人机交互,为客户带来全新的智能服务体验。我们为某直辖市公安机关提供的数字人警察,汇聚了2000多条公安知识,面向1300万注册用户,可以处理300多项业务,极大的提高了公共服务效率。36氪:在NLP等领域,高质量数据的积累至关重要,中关村科金是如何解决这一问题的?张杰:数据积累可以分两方面:一方面,我们为一些中小微企业提供SaaS服务,在客户同意的前提下,SaaS产品上积累的数据可以用于训练我们的预训练对话语言模型。另一方面,原始数据固然重要,但更重要的是数据代表的知识。我们为私有化部署的大客户配备了专业的“话术师”,可以根据客户的行业、业务、场景,提供大量话术模板。这些话术模板都是精炼的数据,其中一部分也可以跨行业复用。就像金牌销售人员一样,是可以跨行业的,既可以卖汽车,也可以卖金融产品。36氪:在对话式AI领域,从技术到产品,再到解决方案,要跨越几道障碍?张杰:严格来说,我们不是按照“技术→产品→解决方案”这一顺序开展业务的。我们是先提供的解决方案,再沉淀底层技术,最后形成产品化能力。中关村科金的创始团队,凝聚了一批懂行业的业务专家,让我们第一步能够向客户证明中关村科金提供的解决方案的商业价值。第二步,我们开始沉淀核心技术,练就“AI绝活”,形成技术门槛。到了第三步,我们开始强化产品化能力,加强中间层建设,将技术组件化,保证工程性能。这个阶段考验的是产品设计能力、架构能力、组织能力。最终的目的是提升交付效率,降低交付成本。36氪:在具体的应用场景中,中关村科金是如何优化产品逻辑与技术细节,以满足客户的需求指标的?张杰:关于优化产品,各家都有自己的措施。中关村科金产品优化的指导原则就是“以客户为中心”,我们要求产品经理不要“闭门造车”,而是多与客户沟通。在服务标杆客户的过程中,我们不以项目交付为结束节点,而是要与客户长期陪跑,陪跑是优化产品的一条捷径。通过陪跑可以不断收集甲方的使用者反馈和最终用户的反馈,以最终的业务效果为目标不断优化产品。可以简单介绍几个客户成效案例:•基于语音合成技术的外呼机器人,应用在西南某市公安部门,单个机器人每年外呼量达数10万通,配合人工坐席,与传统全人工模式相比,可降低90%的成本。•基于知识库问答技术的客服机器人,应用在某保险公司客服接待、咨询等业务场景,问答准确率达到90%以上,提供7*24小时服务,可分流60%+的客户咨询。•基于语音识别、图像识别、视频服务等能力的全自助智能视频签约系统,用在某信托公司的,面向C端客户提供全自助的智能视频签约服务,可批量化、自动化进行视频面签;在实现机构人力成本减少60%的同时,客户满意度提升90%。•基于音视频技术的远程双录系统,用在某大型股份制商业银行,通过远程方式,提高业务办理效率,效率提升200%,投诉比例下降70%,抽检比例由人工的1%-5%,实现100%全业务覆盖,至今“0”骗贷行为。36氪:在您看来,对话式AI未来的技术演进路线是什么?对话式AI未来将如何改变各行各业的商业逻辑?张杰:我们可以从细分赛道、交互形式、技术演进三方面来畅想一下对话式AI的未来:细分赛道方面,对话式AI可以分为ToC和ToB赛道。ToC赛道的代表产品是语音助理,如Siri,以及各类智能音箱、智能家电等。从对话系统的分级定义上来看,目前ToC的消费类应用能达到L3等级。这些市场的饱和度已经比较高了,主要的参与者也是各类互联网公司,我们认为,ToC的赛道,留给后来者的市场空间可能已经不多了。ToB赛道以企业服务为主,总体的市场渗透率仍较低,技术成熟度也相对落后,目前还是一片蓝海。从细分行业来看,目前最成熟的还是金融领域,其他领域如政务、医疗、快消、工业等等,未来三至五年仍然充满机遇。交互形式方面,除了文本和语音交互,多模态交互的应用会越来越多,比如视频客服、电子工牌、远程营业厅、数字人等。随着对话服务场景的智能化、线上化,培养金牌销售、绩优坐席的成本会大幅降低,人工密集型的销售模式可能会不复存在。而对于企业而言,则需要将更多的精力投入到产品研发、品牌塑造与创意营销上,实现更高的业务价值。AI对话引擎,未来会像CRM、CDP系统一样,成为企业必备功能。从技术维度看,对话式AI不仅是对话技术,还会是多种前沿科技的集大成者,融合感知智能、认知智能和决策智能。对于AI对话技术提供商而言,未来的主流收费模式可能会是:通用对话模型+定制化。通用对话模型服务小微企业,满足其基础需求。对于大客户而言,会要求技术厂商提供针对行业、组织甚至特定人群的优化后的模型。微信扫码关注该文公众号作者戳这里提交新闻线索和高质量文章给我们。来源: qq点击查看作者最近其他文章