Redian新闻
>
竹间智能总裁兼COO孙彬:大语言模型如何在企业落地

竹间智能总裁兼COO孙彬:大语言模型如何在企业落地

财经

风起AIGC

AIGC已经成为我们这个时代新的商业分水岭,引领着内容和创意的“寒武纪大爆发”。无论是前沿科技产业还是整个经济社会格局,都将因此产生巨大的变化。为了让创业者更好地拥抱这个时代,创业黑马将以中国AIGC第一服务平台为己任,通过走访多位业内知名企业家、投资人、专家学者和创业实践者,从软硬件平台视角、投资人视角、行业应用视角等维度进行系列报道,共话大模型时代新机会,展现产业新力量。本篇为第八篇。


本期的分享嘉宾是竹间智能总裁兼COO孙彬竹间智能由前微软(亚洲)互联网工程院副院长简仁贤于2015年创办,是认知AI时代下以大小模型双轮驱动的NLP为核心技术的国内领先人工智能企业,通过对话、知识、培训和生成四大产品平台,实现跨行业、跨场景的规模化落地,已累计服务500多家大中型企业。在以ChatGPT为代表的LLM(大语言模型)技术掀起全球浪潮之际,竹间对所有产品系列进行了全线升级,并推出运用多种LLM技术的成熟AIGC企业级产品,帮助白领等知识生产者提高生产力,助力企业完成数智化转型。


在6月8日的黑马AIGC主题系列直播第二季中,孙彬以《大语言模型在To B领域的落地和探索》为主题进行了分享,并展示了竹间智能在生成式AI技术落地方面的商业洞察、布局和重要成果。


以下为本次直播实录整理:

今天我来分享一下,作为NLP(自然语言处理)从业团队,过去亲身经历过的大语言模型发展历程,以及我们看到的未来。

我相信很多人都是最近在网上了解到 Chat GPT这种大语言模型,也分析过很多关于大语言模型和生成式AI的特点、优势或短板。但是其实大语言模型,包括我们所从事的NLP(自然语言处理)产业已经发展了很长时间了。竹间智能团队聚焦NLP已经有8年了,这8年也是NLP真正实现产业化的时期。在此期间,我们一直身处NLP赛道,研究如何将NLP服务商业化,如何进行营销,如何为企业提供服务,如何在C端实现成长,也积累了一些经验和客户。

01
行业变局与四大挑战

在人工智能领域,图像、语音、语义的处理都是一些重要的赛道,NLP就是其中关于自然语义理解的部分。

实际上,在人工智能的语义理解方面,具体可以分为两个部分:一是大家非常熟悉的人机问答,我们叫它短文本,是用来交互的;另一个是长文本,让机器能够对现有的非结构化的文件、文章进行阅读、理解、抽取、提取。这两大领域都是NLP的强势领域,也恰恰是产业化落地的领域。今天我们所熟悉的大语言模型,给大家展示了对话中的高理解、高对话能力,但它更让大家惊艳的地方却是生成的文章、写出的代码、翻译成的语言。

在这两大领域(短文本和长文本),过去各个NLP团队也取得了很多成果,但是在它们落地发展过程中,主要面临四大挑战,而现在大语言模型的出现,则让情况产生了很大的改变。

首先,是深度语义理解及推理。在大语言模型爆发之前,所有的语言模型相对来说都比较轻量,针对一些具体场景,那时首先面临的挑战就是如何能够准确理解客户的意思,大家都不断地在用新的模型优化算法,去了解客户的意图,理解客户的上下文和他们的情绪,但是现在大语言模型极大地拉升了这方面能力。

第二,是基于知识图谱的智能问答。这也是现在大家对大模型最为诟病的地方,因为大模型的知识不是很准确。过去的最佳实践方案,是我们用NLP的模型去理解客户的对话意图,然后用客户方给到的知识和答案实现精准匹配,这样可以帮助对话机器人给出正确回复。

第三个挑战是如何通过语义训练实现问答精准匹配。比如在金融行业,关于信用卡的服务内容其实是有标准答案的,但是客户的问法千差万别,我们如何用语言模型理解客户的意图是一个难题。在To B服务领域,对答案的准确度要求是非常高的,否则会对客户产生误导或造成损害,这一挑战依然延续到大语言模型时代。

第四个挑战,就是任务的流程。大家知道,任何一个大语言模型的聊天能力都很强,但是你要让它完成一个工作,比如说办一张信用卡、重出一张机票,或查询一个工单信息,就有些困难。这种多轮的流程式的对话方式,对大语言模型来说可以很容易去模仿,但是要精准地提供这些数据,还需要另外一层的技术控制。

过去NLP产业落地的这四大挑战,现在依然还存在,但是在很大程度上来说,用大语言模型可以更容易地解决,这就是技术变革给产业带来的好处。在这方面,我们已经应用大模型做出了一些案例,获得了客户的认可。比如一家证券客户的客服中心原先使用的是传统的客服机器人,在使用中暴露出诸多问题,比如业务知识与闲聊混合管理不便于维护,大量知识材料内容和分组不匹配,回答准确率过低等等,40%~50%的电话最后还是要转到人工服务。但是经过技术的加持,机器人的服务占比可以提升30个百分点,就能很大地节约人力,提高效率。

所以,今天的 AI在应用过程中,特别是在To B产业,其实并不像大家想象的那样,一个模型就能够解决所有问题。它实际上是一个像下图这样的平台逻辑:

最底层是基础技术,上面是AI模块,还要通过一些API的方式进行二次开发,最后接入客户的业务场景。最近大家都把聚焦点放在大语言模型的写作能力和对话能力方面,但是从为企业服务的从业者视角来看,虽然目前底层的模型能力有了极大的突破,但要想更好地实现应用,还有很多的能力需要完善。

在今天这个大语言模型产业爆发之际,我们更呼吁所有在赛道中有经验的专业团队,都应该驾驭好大模型,让大模型能够在多场景中落地,实现产业化发展。不但大模型自身要高速发展,大模型带来的创新业务也应该实现高速发展。

02
产业的未来

接下来,我来分享一下站在从业者的视角分析,大语言模型会给产业带来哪些变革?

首先想一下,Chat GPT现象的本质是什么,它给大家带来的经验是什么?相信所有跟它做过对话的人都不仅仅是为了好玩,大家会感觉到“我是在跟一个智能体对话”。这代表了什么?代表人类可以跟语言模型进行沟通了。它能理解你,能回答你,能帮你去执行。大语言模型最好的一点就是它用一种“暴力”的方式带来了足够多的知识,然后又可以理解人的情绪,可以跟人对话,这恰恰将以前人和机器交互的瓶颈问题解决了。

从这一点出发,我的第一个判断,是大模型会改变我们现在的软件范式。相信做IT的同事们对此都有切身体会,当PC出现的时候,当互联网到来的时候,当手机应用开始爆发的时候,软件范式都曾发生过改变,从工业软件到PC软件,到网站和手机APP,再到现在的大模型热潮,软件范式又将被改写一次。

那么,大语言模型来了以后,软件应用会是什么范式?我们通过对话的方式就可以调动各种各样的应用。如果说以前我们是应用为主导,今后我们可以非常明确地想象,人会跟手机或者智能硬件沟通,然后由它来完成相应的软件操作,所有应用之间的屏蔽会被打破,应用的能力会被调用,大语言模型直接调动应用能力会形成新的交互方式,这将是一个新的操作系统,新的“iPhone 时刻”。

在未来2~3年内,我们大量的C端应用,都会因为对话方式的改变而改变,很有可能不再是触摸式输入,而是语音输入,很多行动也会打破应用的边界,可能每个手机都会有个AI助手,它可以通过对话的方式调度多个应用能力,下单、叫车、购买都可以通过语音来完成,接下来会有千千万万个基于类ChatGPT模型的应用出现。

以上是C端的变化,那么B端会怎样变化?我的第二个判断是,在B端,企业/行业的私域知识会变得至关重要,产生大量的企业Chat GPT、行业Chat GPT。

目前,大语言模型的特点是它可以高度理解人的语义,并且可以做一些深层次的工作,比如写作、推理、分析等等,但是它的知识是不可被依赖的。这是因为用来训练的互联网数据是不可靠的,今天的大语言模型实际上是一个对话模型,并不是一个问答模型。它是为了对话而产生的,所以它会妥协,会认错,为了让对话继续进行下去,它会根据对话的人的喜好改变内容,但是它并不是一个具备正确知识的模型。

但对企业客户来说,我们的行业总监、客服、营销人员、政策咨询人员,绝对不能给客户不准确的知识。所以,在B端一定会发展成这样的范式:大语言模型做沟通和理解,加上私域知识——准确的私域知识——然后驱动行业/企业的应用,行业/企业的应用也会因为这一变化而变化。

那么,企业的私域知识怎样构建?我们可以回顾一下企业数字化的发展过程,最早的时候,我们把设备联网叫数字化,这是第一代的生产数字化;第二步,我们将ERP,包括生产制造系统使用起来,实现全业务流程IT化,这是第二代的资产数字化。

现在,我们有了大语言模型,有了行业/企业的私域知识,真正地让企业的hr部门、行政部门、销售部门、客服部门……所有的知识全部用对话或者阅读的方式表达出来,就真正让企业智能化了。

人工智能发展到一定阶段之后,可以将知识利用起来,就实现了进化,我们将从数字化时代进化到数智化时代。

在接下来的时间,我们会看到越来越多的企业将部门的知识、企业的知识甚至行业的知识利用人工智能技术变成知识库,变成可以被AI构建和调用的知识,形成知识流,然后让这些知识变成数字人,服务我们的企业,服务我们的客户。

我们可以预测,在未来的一年,企业服务的这些内容会呈现指数级的增长,会提升至少10倍以上。从事To B行业的创业者,一定要对此做好准备。

03
未来的四个新挑战

那么,未来大模型发展将面临哪些新挑战?

除了前面提到的四大挑战之外,作为技术从业者,我在这里跟大家分享几个我们看到的新挑战:

第一个挑战就是大模型阅读 or 知识图谱预建?过去我们做了很多的知识图谱,但是今天的大语言模型可以阅读文档,可以阅读那些非结构化的数据。那么,到底是不是还需要建立知识图谱?换一种说法,就是今天是要预设好答案,方便来问答和查询,还是要让大语言模型自己去阅读内容,然后给你答案?

其实,这两种实践路径都可以完成很多的内容查询,但是最终哪个效果好,哪个准确率高,我相信应该是不同的场景使用不同的模式。也许有人会问两种结合在一起会不会更好?答案很值得期待,希望我们的从业团队用工程能力给出结果。

第二个新挑战是“Prompt?Embedding?Fine-tuning? ”这三个词都是现在特别热的词。Prompt是提示词,Embedding指嵌入接口,Fine-tuning指模型微调,都是训练大模型要做的工作。但目前其实并没有多少团队能够把模型调好,可能在微调的过程中间,越调越差。所以今天我给到大家的建议,就是不要迷恋对大语言模型进行微调,最终要以结果可控和高质量目标作为标准。利用大语言模型的能力加上自身的工程能力,比如对知识图谱、对客户数据的调用,然后利用数据的能力,最终满足客户的需要才是王道。

第三个新挑战,到底是应该做大语言模型,还是做专业模型?我的观点是通用大语言模型有它的优势,专业模型也有它的场景,每个模型其实都有它的能力特点。我们认为通用大语言模型适合于To C端进行对话和训练,专业的模型适合于在行业内调取专业的知识,完成专业的任务。

第四个新挑战:大模型应该云端调用还是私域部署?在10年前,大家就在讨论公有云好还是私有云好,其实我们看到今天这两者是并存的。云计算和AIGC产业发展有相似之处,通用模型适合于各种各样的中小企业,通用灵活;专业模型安全性高,数据可以控制,它要为企业服务,数据要准确,要完成不同的任务。所以我们可以这样预测,未来会有几个头部的企业提供最优秀的大语言模型来为大家服务,但同时也会有千千万万的行业私有云、企业私有云,千千万万的行业模型和企业模型。

未来,公有的大模型一定会越做越强,会由头部的几个企业来领导,行业的私有模型一定会百花齐放,这也是我们很多To B企业的商机。

我们相信,ChatGPT现象将给我们带来巨大的AIGC红利。写作类、绘画类、创作类的职业会实现巨大的提效。大模型归根到底是一个工具,会使用工具的人将会淘汰不会用工具的人。

智能家居行业会有很大的发展,过去每个家庭的环境太复杂,所以大家没有办法在家庭环境中预设好各种对话,现在大语言模型应用之后,对智能家居行业又会有很大的促进。

同样还有个人助手类的应用,我认为会有极大的发展。AI可以帮你订机票、订餐、更改日期,还有去执行一些预约,甚至去购买一些东西,我们期待着今年下半年会有很多个人助理类的应用大爆发。

此外,还有元宇宙的“ IP 众包”模式、情感陪伴类产品等等,都会迎来爆发。

竹间智能是2015年成立的一家NLP专业公司,我们的核心能力就是将短文本NLP和长文本NLP处理能力,结合我们的专业模型,以及现有的大语言模型,实现不同的应用场景落地,做出不同的数字员工,来为企业和个人提供服务。我们也希望能够跟行业内所有的玩家共勉,一起来享受 AIGC带来的产业爆发,共同做好AI在各个行业的落地。


扫码加入黑马创业者交流群
↓↓↓

扫描下方二维码
加入黑马AIGC产业营
读懂AIGC底层逻辑,一步接入产业未来
↓↓↓

点击底部分享、赞和在看,完成三连击,把好的内容传递给更多需要的人。


更多精彩内容,尽在i黑马视频号

↓↓↓

关注黑马传播矩阵,get更多精彩内容
↓↓

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
揭秘大语言模型实践:分布式推理的工程化落地才是关键!符尧 | 复杂推理:大语言模型的北极星能力QCon 15 年特别策划:大语言模型如何给前端开发者带来新体验如何在企业合规赛道领跑?你需要这套落地方法论对话竹间智能简仁贤:做大模型不能唱高调,企业需要低成本、平民化的模型产品上海内推 | 上海人工智能实验室招聘大语言模型算法研究实习生谷歌最新《自然》论文:大语言模型构建的AI医生,比人类医生更出色阳春三月的思念学习生成式大语言模型,东北大学自然语言处理实验室有一堂课大语言模型的多语言机器翻译能力分析遭遇杀猪盘(1)从冬天直接到夏天硬核科普:大语言模型,都是如何生成内容的大型语言模型专场上线!四位AI新青年直播讲解MiniGPT-4、LLaVA、Gorilla以及大型语言模型Token危机WAIC十大AI商业落地趋势:大模型新玩家融资难度升级,云计算洗牌战来了微软发布 Guidance 语言,用于控制大语言模型Google 本周或发布新大语言模型/iPhone 16 Pro 或采用固态按键/百度旗下小度将发布智能手机WAIC 2023 | 张俊林:大语言模型带来的交互方式变革OpenAI CEO:大语言模型规模已接近极限,并非越大越好百度肖阳:大语言模型重构搜索引擎,让搜索越来越懂用户幻象 or 事实 | HaluEval:大语言模型的幻象评估基准InfoQ:大语言模型综合评测报告2023ChatGPT的朋友们:大语言模型经典论文一次读到吐OpenAI CEO:大语言模型规模已接近极限;余承东:造车 2025 不赢,以后没机会;苹果或曝多款新电脑 | 极客早知道Google提出LaCLIP:大语言模型重写本文输入,让CLIP重焕光彩!坚持做行业大模型,竹间智能给大模型造了一座「模型工厂」张俊林:大语言模型带来的交互方式变革反问句符尧最新研究:大语言模型玩砍价游戏?技巧水涨船高!因朋友的私事再次去了法庭语言模型如何拯救“桃子公主”?MIT团队打造未来实验室:大语言模型与人类优势互补,全程紧密配合复杂推理:大语言模型的北极星能力AI大模型如何在行业实际落地:企业对话场景拥抱大模型之路深度学习三巨头之一 Yann LeCun:大语言模型带不来 AGI
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。