Redian新闻
>
腾讯汤道生:大模型,方向比速度更重要

腾讯汤道生:大模型,方向比速度更重要

公众号新闻

国产大模型,再添新劲旅。

9月7日,在腾讯一年一度的全球数字生态大会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生宣布,腾讯将迈入“全面拥抱大模型”时代。同时,其自主研发的通用大模型——混元也正式对外发布,揭开了外界猜测已久的腾讯大模型面纱。

坦白说,在四、五月份国内大模型“遍地开花”时,与其他厂商相比,腾讯的确会有一点略显“沉默”的感觉,所以在这次混元大模型发布后,业界也不乏有腾讯在大模型赛道上“姗姗来迟”的声音。

但从汤道生的分享以及混元背后的故事来看,于大模型,腾讯可以说是“蓄谋已久”,其思考点和发力方向也很不一般。

具体来看,我们可以梳理为以下4点:

第一,务实主义,从产业痛点出发,做的是解决实际问题的事。

在腾讯的视角中,大模型的能力绝不仅仅局限在聊天上,而是要能够与产业场景和企业需求相结合,实实在在给到企业和行业支持。

因此,在今年6月,混元大模型亮相之前,腾讯就先行一步公布了腾讯云MaaS服务和行业大模型精调解决方案,也基于行业大模型,对现有的To B产品线,做了智能化的升级,为的就是让大模型的能力,在产业中快速用起来。

比如腾讯会议,借助大模型,已经可以实现自动整理会议摘要、会管会控等功能,极大提升了会议效率,这就是把技术能力真正落地到了实际场景和需求当中。

第二,心态开放,允许企业根据不同业务场景,选择不同的模型,做定制化开发和精调。

腾讯混元大模型是一个基底模型,企业可以通过API调用,结合自有数据做模型精调,与业务场景无缝结合。但这不是企业的唯一选择。

腾讯云的MaaS服务,提供的是一个模型精选商店,不仅有混元,也提供了超过20个开源大模型,客户可以有多元化的选择。

于腾讯而言,大模型的目标一直很明确,就是能够帮助不同企业解决真问题、真痛点,把选择权交到客户手上。不得不说,这就是一种典型的开放心态。

第三,保持节奏,任“风口”来袭,亦不改步伐,一切凭产品力说话。

有句话讲,“慢慢来比较快”。从腾讯来看,“慢工出细活”一直是其很鲜明的一大特质,这一点在大模型的研发上也得到了明显体现。

早在2016年,腾讯便已经建立了四大AI实验室,涵盖AI从全面基础研究到多种应用研发,去年4月,又披露了混元AI大模型的研发进展。

显然,在大模型的探索上,这些年来腾讯就没停下过脚步,但为什么直到今天才正式亮相呢?原因无他,就是要反复锤炼,把大模型的准确度和可靠性打磨到最佳。

正如马化腾所言:

“对于工业革命来讲,早一个月把电灯泡拿出来,在长的时间跨度上来看是不那么重要的。关键还是要把底层的算法、算力和数据扎扎实实做好”。

今天来看,这就是“做三四月的事情,在八九月自有答案。”

第四,笃信未来,看重的是长期价值而非短期利益。

目前来看,在大模型的商业化上,腾讯并没有显得特别着急,更多的还是将其视为业务的“倍增器”,重点在于让更多的客户接触和使用到,进而不断丰富和完善混元大模型解决问题的能力。

这方面,汤道生讲得也很透彻:

“ToB的技术以及市场渗透可能是以十年作为单位,大模型是一场马拉松,现在可能才跑到一公里。”

我们可以理解为,腾讯是把大模型的商业回报放在了未来,而当下要做的是让产品有用,让技术发展。

“现代管理学之父”德鲁克先生曾说过这样一句话,被认为“商业之美”最好的形容:“世界上之所以出现鞋匠,是因为有人需要鞋,而不是因为鞋匠需要钱。”

一样的道理,大模型技术最终也是要为人而服务的,是要满足某种需求的,是能够切切实实解决问题的。

从这一角度来看,腾讯背后的那份务实与本分,真的很值得行业深度思考一番。

以下是汤道生接受媒体时的专访内容,细细品读,相信你一定能从中感受到腾讯大模型的朴素务实和与众不同。

来 源:正和岛(ID:zhengehdao)

腾讯集团高级执行副总裁、腾讯云与智慧产业事业群CEO汤道生


记者:其实2021年开始,每个云厂商都在反思大集成模式,转到健康可持续增长的道路上去。但是我们发现,很多公司至今依然非常摇摆,管理层内部也有很大分歧,与之相反,腾讯云执行得非常彻底。今年看财报来说,已经走过了“最难的阶段”,这个过程中,腾讯云有过哪些阵痛?为何能够如此坚定地推动转型?



汤道生:
我们从来没有犹豫过要不要走回头路,做健康可持续的业务,一直是腾讯做业务、做事情的基本原则。做TO C业务的时候是这样,今天做TO B也是一样。腾讯的管理层在这个问题上是高度一致的,相对来讲,我们可以走得更坚决、更纯粹。

要坚定地推动转型,首先是要想清楚,到底什么指标是最重要的。

衡量业务发展的指标有很多,整体的收入数字,只是其中一个,而且不一定有代表性,关键还是要看收入的结构,其中有没有水分,比如转售的比例有多少?人力外包的服务有多少?不应该把这么多不同的产品混在一起,只看一个笼统的大指标,用这个指标,来评判每个不同团队做得好不好。这不科学,也没有意义。我们要把指标拆开,一个一个看。想明白了,知道什么指标更重要,那就坚持往那个方向走。

既然我们想清楚了,腾讯的To B业务要走“被集成”,基于自研产品来发展,那么业务的关注点,就放在了每一个产品赛道上,考核指标就会围绕产品来设定。

比如腾讯会议,我给团队的考核更多是,你在会议这个市场,有没有做到极致,做到客户认可你的价值。至于收入多少,这和业务所处的阶段有很大关系,我更相信未来的潜力。腾讯会议现在已经有比较好的基础,未来十年甚至更长时间,这个产品也会一直往正向发展。

再比如数据库,尽管市场竞争激烈,但我们的产品,在这个市场得了客户的认可,有很多国有大银行的订单,口碑非常不错。

其实,每一个产品所在的领域,都是一个相对独立的市场。我考虑的是,如何确保这个产品模块的团队,做到行业数一数二。

比如“零信任”产品,是否已经做到国内客户最认可?再比如音视频,虽然我们连续好几年在国内排名第一,但面对新场景不断冒出的机会,我们的团队有没有抓住?团队的小伙伴,也一直在往这个方向努力,像音视频,最早是服务泛娱乐直播场景,到现在是远程会议场景,最近两年,又有很多新的产业场景,比如矿山里的无人矿车、集装箱码头的无人集卡,都有用到我们的音视频技术。


记者:把指标拆开看,反映了腾讯非常“务实”的一面,这一点在AI布局上似乎也能看到。比如当初,咱们没有跟风去抢发一个通用大模型,而是立足产业,率先推出了“行业大模型”,能否具体谈谈,咱们在AI尤其是大模型上的布局思考?



汤道生:
AI在今年确实很热,客户需求很强。不仅仅是大语言模型,而是所有AI相关的能力,比如机器视觉、语音识别、数智人等等,都特别感兴趣。我们其实一直持续在AI上加大投入,从研究算法到服务客户的场景需求,全面地布局。

很多人都喜欢从TO C的角度,去关注和使用通用大模型,比如,很多人花很大的精力去测试,让一些通用大模型去“胡言乱语”,而不是把它用在产业上。

我觉得对于大模型,最务实的做法,还是回到每个企业自身的痛点,比如降本或者增效,基于痛点,用大模型去解决产业实际问题。可能刚开始使用的版本,只能解决问题的80%,但因为你有一个很清晰的使用场景,用户的反馈,能够形成反哺,帮助你不断打磨模型性能,让解决问题的准确率,一步一步地提高。

正是基于这样的考虑,我们从几个方面,帮助产业,真正把大模型的能力用起来。

首先是打造高性能的AI基础设施。海量大数据处理,模型的训练、推理、部署和运维,以及智能化应用开发、调试等等,都离不开高性能的计算、存储和网络通信能力。

所以我们打造了高性能计算集群HCC、高性能网络星脉、向量数据库等产品,能够帮助客户快速、低成本构建大模型和智能应用。

二是提供多元化的模型选择和精调解决方案。随着大模型的产业落地,大家更关注如何寻找与自身业务更匹配的模型底座,训练出符合自身需求的专属模型,为此我们推出了腾讯云MaaS服务,打造“行业大模型精选商店”和精调解决方案。

今年大会的主论坛中,我们正式亮相了腾讯自研通用大模型——混元,它有超千亿参数规模,预训练语料超2万亿tokens,有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力,经过腾讯内部的很多产品中验证,效果不错。企业可以通过API调用混元,或者将混元作为基底模型,为不同产业场景构建大模型应用。

混元之外,在腾讯云行业大模型精选商店中,我们还上架了20多种行业最新、最流行的开源大模型,以及20多个领域的行业大模型。企业可以根据需要,选择合适的模型,然后借助腾讯云智能的TI平台,导入企业专有数据,做进一步的训练与精调,快速生成更有针对性的专属大模型,满足企业个性化需求。

三是推出一系列智能化的应用,推动业务全链条智能。我们基于大模型打造了全栈产品体系,应用于业务不同环节,帮助企业全链条提质增效。比如金融行业,大模型的能力已经应用在开户、业务处理、风控、售后客服等多个业务场景。

客户服务中,专属大模型与数智人的结合,几分钟就可以完成一次在线开户;在海量单据处理中,基于大语言模型能力TI- OCR,通过少量标注样本,就可以识别回单、发票、申请书等多种表单,准确率超过95%,而且还能自动提炼核心标签,生成电子数据文件,进行后续的商业分析。

借助金融风控大模型,金融机构通过小样本提示,就可以自动生成专属的反欺诈模型,建模整个流程时间从2周减少到2天,整体反欺诈效果也提升了20%左右。



记者:您觉得,通用大语言模型未来最有潜力的应用场景是什么?腾讯云的行业大模型,会重点选择某些行业吗?比如像你刚刚提到的金融行业。



汤道生:
大语言模型的核心是自然语言处理,语言一般首先是用在跟用户有沟通、交流的场景中,比如客服、售后。通过大语言模型,能够实现降本增效,或者提升用户体验。所以,跟用户打交道比较多的场景,大语言模型能发挥价值的地方也更多。还比如文生图的能力,可以用在需要频繁做图的场景,比如广告投放、营销等等,但也不是所有的行业,都需要做在线投放和营销,还需要对行业和客户做进一步筛选。

其实,各行各业对大模型普遍都很感兴趣,都在各自探索创新的落地方式。比如医疗领域,腾讯健康积累了很多健康领域的知识,给超过1000家医院去提供AI导辅诊的能力,为患者提供更准确的咨询、更详尽的解答。

刚才跟一个客户交流,他们非常感兴趣怎么通过医疗行业大模型来服务聋哑群体。融合大语言模型、数智人、机器视觉技术,就能把语音沟通变成手语沟通,帮助患者解答健康问题。

通过这些案例可以看到,大模型的产业应用,可能不一定是天马行空、很“嗨”的场景,也许就是怎么让售后服务高效,能更快解答客户的疑问,虽然朴实但有用。

我们自己就比较喜欢基于自身的业务场景去构造产品,打磨产品,达到满意的效果,然后把产品开放出来,给行业客户去用。

比如我在会上分享的乐享,它也是我们内部知识库社区,CSIG上万人中,大量一线人员都是通过这个平台,了解产品的最新功能,反馈问题,让产品不断去补齐能力;产品人员也可以把经典的客户案例、产品QA放在上面,方便一线销售人员去应对客户咨询和提问,信息非常丰富。

但是以前,员工想要从这么大体量的知识库里,找到想要的信息,不是那么容易的。所以,我们基于行业大模型,打造了AI助手,用户通过自然语言提问,就能快速从繁杂多样的资料中,快速找到想要的信息,效率非常高。

这个过程中,也会面对大量数据的存储、查询等突出问题,我们通过向量数据库,把非结构化的数据,有序地存储以及快速检索,很好地解决了这个难点。

不只是乐享,当年我们做腾讯会议,也是觉得原来的会议软件不好用。如今,我们又在腾讯会议中上线了AI小助手,能够实现会议内容自动摘要、会管会控;还有客服场景,我们也非常关注,重点打造了腾讯企点智能客服这个产品,借助大模型,我们把产品和服务的相关资料输进系统,给到客服人员,他们给企业提供售后和服务时,就能够快速找到答案,更高效地完成一个工单。这些场景,其实都很实在。

过去四个月,我们不断地通过大模型,去升级腾讯云的所有产品,基于自身的场景,打磨产品,很多客户对于腾讯云产品的这些新能力都非常感兴趣,也觉得很实在。



记者:在激烈的市场竞争中,腾讯的行业大模型上有哪些突出的差异化优势?基于这些优势,行业大模型会我们带来哪些商业上回报?



汤道生:
我们更多关注的是,让很多行业客户去使用,看看到底怎么用好大模型的能力,去解决具体的问题。也不仅仅关注模型本身,还包括,如何帮助客户用好本身已有的数据,这些数据可能都不是公开的,但却是在企业自身的业务场景里,回答某些问题时所必须的。

用好数据的过程中,会涉及到模型的训练、精调、数据标签的管理等工作,同时要降低模型的使用成本,还需要做训练加速的工作。

所以,从一个大模型,到提供一个用户可以感受到的服务,中间有很多的环节和工序。腾讯其实是提供,整个端到端的AI服务流程中所需要的“全链条工具”。我们的TI平台就是一个能满足整个工序、环节的需求,给客户提供高效模型搭建服务的重要工具。这可能是大家比较少从友商那里听到的。

至于商业化,现在谈这个可能有点早,但很多机会是能够看到的,比如训练需要非常大的算力,今天的计算成本很高,会带来一定收入。另外,模型搭建和精调过程中,要用到的工具,形成客户依赖,长期来看,也会建立起一个可持续的商业模式。


记者:听您介绍说,混元在腾讯内部已经有超过50个业务场景中有应用,未来公司管理层对于腾讯内部业务,接入混元的态度,更会类似于业务全面上云、统一动作,还是说,业务可以自主选择是否做接入?



汤道生:
我们的内部管理相对比较开放。很多场景、产品都在使用大模型,方式也比较多样。他们接入了混元,但同时也会针对业务自身的场景数据,做一些定制化的模型开发和精调。

腾讯做大模型,既有整合力量办大事的地方,比如说混元,公司只会有一个,因为它有非常高的投入,也需要非常专业的人才、资源来支持。但是针对不同的产品场景,其实需求差异蛮大的,我们会允许不同的应用,去选择最符合客户需求的一些模型,重点是每一个产品是不是能够给用户,提供最好的体验。

比如,腾讯会议其实在早期,也尝试接入了第三方的模型,跑通整个业务流程。有些甚至就是在客户自己的开源模型上,基于企业数据构建一个专属模型,来对接腾讯会议。

对内我们保持开放,对外也是一样。今年6月,我们在行业大模型技术交流会上就说,不同行业、不同场景的需求很不一样,可能需要不同的模型,有针对性地提供支持,需要有多样化的模型选择。我们既给客户提供混元大模型这样一个底座,也把几十个开源模型,放在腾讯云智能的大模型商店里,提供给客户使用。

开放,其实是我们做To B业务的一个非常重要的价值观。不只是大模型,包括像数据库,也有很多细分类目,这么多年,大家一直在用不同的数据库,解决不同的问题。我们的TDSQL在TPC-C打榜拿到了世界冠军,解决的是海量高并发场景下在线交易的问题,如果用AP分析型数据库,可能就无法解决。

前一阵,我们也发布了针对大模型场景下,满足客户需求的向量数据库,解决的是企业使用大模型前需要处理的数据清洗、处理等问题。

我一直觉得,要比较务实地看待技术,什么问题适合用什么技术、什么方式来解决,就去给用户提供合适的工具。而不是说你手上有一个锤子,看到什么都是钉子,只有一招。这不是CSIG用技术解决产业问题的理念。


记者:最后想问的是,大模型发展初期,需要不断试错,技术成型可能需要十年或者几年的长度,我们一方面要降本增效,另一方面又要去做这样的长期投入,这么去平衡?



汤道生:
资源分配需要有节奏,我有一个“721”的管理理念,70%的资源投入在当期收入和利润上,这样才能让团队生存;20%投入在发展中期的技术,这种技术可能再多两年,就会有商业化变现,可以作为增补项来补充成熟业务;最后的10%,是投在仍处于发展早期的前沿技术,是面向未来的机会布局,可能要三五年甚至更久才能带来商业回报。对于腾讯这样的公司来说,我觉得这样的规划是比较合理的。

AI将会是我们的一项长期的、战略性的投入,因为我们非常看好它的未来。就像90年代互联网,作为新技术,大家也有很高的期望,但也经历2000年的泡沫破灭,这并不代表互联网技术就没有价值。后来,随着PC互联网的发展,互联网能连接很多数据、设备,兴起一波浪潮,腾讯也是获益的企业之一。再到移动互联网时代,能连的设备更多了,终端的能力也更强了,又迎来一次新的爆发。

我觉得AI技术也是这样一个发展模式,早期的AI能力能在部分场景,解决部分问题,但是每一次的技术升级、能力进步,又会打开更多新的机会,AI未来还会有更多能力的提升,我们非常看好,也会持续投入。



排版 | 星辰

编辑 | 星辰   轮值主编 | 夏昆

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
Nat Commun丨白尾鹿中广泛检出新冠病毒,且进化速度更快;急需监测可能的反向传播10所美国头部计算机专业学校的横向比较(下)先进的科学与先进的心理学华为率先把大模型接入手机!小艺+大模型,智慧助手智商+++朱啸虎:不要追逐大模型,要跟着大模型进化保时捷被曝曾向比亚迪寻求合作遭拒?力争2030年超8成新车为纯电车,超豪华品牌加速电气化当 Apache Doris 遇上大模型:探秘腾讯音乐如何基于大模型 + OLAP 构建智能数据服务平台腾讯混元大模型开放文生图;微软AI投资重心或转向应用和业务;国产大模型10月榜单公布丨AIGC大事日报北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型手机大模型爆发:vivo 发布自研蓝心大模型,参数追赶 GPT-3投资的纵向比较和横向比较大都会博物馆现在正在进行时【游吟诗稿】像瓦格纳热爱夏天百度云上交大模型成绩单:接入42个大模型,月活企业近万家|甲子光年接入Llama 2等33个大模型,上线Prompt模板,百度智能云千帆大模型平台重磅升级蚂蚁原副总裁漆远创业公司被曝all in大模型,原方向AI制药不做了曝OpenAI大模型新进展!将推出多模态大模型,新项目Gobi筹备中大数据在大模型趋势下的“新姿态”:大模型与企业数据充分协同全面拥抱大模型!腾讯正式开放全自研通用大模型:参数规模超千亿、预训练语料超 2 万亿 tokens关明生:初心比努力更重要,好问题比好答案更重要黑白女史(12)以貌取人腾讯AI将至!消息称腾讯9月初发布混元大模型,多款软件已接入测试对话程斌、刘洛麒:大模型未必是坦途,但一定是方向10所美国头部计算机专业学校的横向比较(上)小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大引入33个大模型,百度智能云千帆大模型平台的“破茧时刻”李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型对话王小川:决定大模型的胜负,钱很重要,人更重要前三季度GDP同比增长5.2%!国家统计局:虽然人口数量有所下降,但是我们人口质量改善速度更快腾讯推出混元大模型,已接入微信搜一搜、腾讯会议等 50 多个业务及产品向比亚迪等多家中国车企寻求合作,却被拒绝?保时捷中国工作人员回应张一鸣:选择比努力更重要,观念比选择更重要汤道生的下一场战事:大模型时代的产业「智能化」升级战怎么打?通用大模型转向行业大模型:腾讯云、华为云们的下一个战场
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。