腾讯汤道生：大模型，方向比速度更重要

2023-09-09 07:09

国产大模型，再添新劲旅。

9月7日，在腾讯一年一度的全球数字生态大会上，腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生宣布，腾讯将迈入“全面拥抱大模型”时代。同时，其自主研发的通用大模型——混元也正式对外发布，揭开了外界猜测已久的腾讯大模型面纱。

坦白说，在四、五月份国内大模型“遍地开花”时，与其他厂商相比，腾讯的确会有一点略显“沉默”的感觉，所以在这次混元大模型发布后，业界也不乏有腾讯在大模型赛道上“姗姗来迟”的声音。

但从汤道生的分享以及混元背后的故事来看，于大模型，腾讯可以说是“蓄谋已久”，其思考点和发力方向也很不一般。

具体来看，我们可以梳理为以下4点：

第一，务实主义，从产业痛点出发，做的是解决实际问题的事。

在腾讯的视角中，大模型的能力绝不仅仅局限在聊天上，而是要能够与产业场景和企业需求相结合，实实在在给到企业和行业支持。

因此，在今年6月，混元大模型亮相之前，腾讯就先行一步公布了腾讯云MaaS服务和行业大模型精调解决方案，也基于行业大模型，对现有的To B产品线，做了智能化的升级，为的就是让大模型的能力，在产业中快速用起来。

比如腾讯会议，借助大模型，已经可以实现自动整理会议摘要、会管会控等功能，极大提升了会议效率，这就是把技术能力真正落地到了实际场景和需求当中。

第二，心态开放，允许企业根据不同业务场景，选择不同的模型，做定制化开发和精调。

腾讯混元大模型是一个基底模型，企业可以通过API调用，结合自有数据做模型精调，与业务场景无缝结合。但这不是企业的唯一选择。

腾讯云的MaaS服务，提供的是一个模型精选商店，不仅有混元，也提供了超过20个开源大模型，客户可以有多元化的选择。

于腾讯而言，大模型的目标一直很明确，就是能够帮助不同企业解决真问题、真痛点，把选择权交到客户手上。不得不说，这就是一种典型的开放心态。

第三，保持节奏，任“风口”来袭，亦不改步伐，一切凭产品力说话。

有句话讲，“慢慢来比较快”。从腾讯来看，“慢工出细活”一直是其很鲜明的一大特质，这一点在大模型的研发上也得到了明显体现。

早在2016年，腾讯便已经建立了四大AI实验室，涵盖AI从全面基础研究到多种应用研发，去年4月，又披露了混元AI大模型的研发进展。

显然，在大模型的探索上，这些年来腾讯就没停下过脚步，但为什么直到今天才正式亮相呢？原因无他，就是要反复锤炼，把大模型的准确度和可靠性打磨到最佳。

正如马化腾所言：

“对于工业革命来讲，早一个月把电灯泡拿出来，在长的时间跨度上来看是不那么重要的。关键还是要把底层的算法、算力和数据扎扎实实做好”。

今天来看，这就是“做三四月的事情，在八九月自有答案。”

第四，笃信未来，看重的是长期价值而非短期利益。

目前来看，在大模型的商业化上，腾讯并没有显得特别着急，更多的还是将其视为业务的“倍增器”，重点在于让更多的客户接触和使用到，进而不断丰富和完善混元大模型解决问题的能力。

这方面，汤道生讲得也很透彻：

“ToB的技术以及市场渗透可能是以十年作为单位，大模型是一场马拉松，现在可能才跑到一公里。”

我们可以理解为，腾讯是把大模型的商业回报放在了未来，而当下要做的是让产品有用，让技术发展。

“现代管理学之父”德鲁克先生曾说过这样一句话，被认为“商业之美”最好的形容：“世界上之所以出现鞋匠，是因为有人需要鞋，而不是因为鞋匠需要钱。”

一样的道理，大模型技术最终也是要为人而服务的，是要满足某种需求的，是能够切切实实解决问题的。

从这一角度来看，腾讯背后的那份务实与本分，真的很值得行业深度思考一番。

以下是汤道生接受媒体时的专访内容，细细品读，相信你一定能从中感受到腾讯大模型的朴素务实和与众不同。

来源：正和岛（ID：zhengehdao）

腾讯集团高级执行副总裁、腾讯云与智慧产业事业群CEO汤道生

记者：其实2021年开始，每个云厂商都在反思大集成模式，转到健康可持续增长的道路上去。但是我们发现，很多公司至今依然非常摇摆，管理层内部也有很大分歧，与之相反，腾讯云执行得非常彻底。今年看财报来说，已经走过了“最难的阶段”，这个过程中，腾讯云有过哪些阵痛？为何能够如此坚定地推动转型？

汤道生：我们从来没有犹豫过要不要走回头路，做健康可持续的业务，一直是腾讯做业务、做事情的基本原则。做TO C业务的时候是这样，今天做TO B也是一样。腾讯的管理层在这个问题上是高度一致的，相对来讲，我们可以走得更坚决、更纯粹。

要坚定地推动转型，首先是要想清楚，到底什么指标是最重要的。

衡量业务发展的指标有很多，整体的收入数字，只是其中一个，而且不一定有代表性，关键还是要看收入的结构，其中有没有水分，比如转售的比例有多少？人力外包的服务有多少？不应该把这么多不同的产品混在一起，只看一个笼统的大指标，用这个指标，来评判每个不同团队做得好不好。这不科学，也没有意义。我们要把指标拆开，一个一个看。想明白了，知道什么指标更重要，那就坚持往那个方向走。

既然我们想清楚了，腾讯的To B业务要走“被集成”，基于自研产品来发展，那么业务的关注点，就放在了每一个产品赛道上，考核指标就会围绕产品来设定。

比如腾讯会议，我给团队的考核更多是，你在会议这个市场，有没有做到极致，做到客户认可你的价值。至于收入多少，这和业务所处的阶段有很大关系，我更相信未来的潜力。腾讯会议现在已经有比较好的基础，未来十年甚至更长时间，这个产品也会一直往正向发展。

再比如数据库，尽管市场竞争激烈，但我们的产品，在这个市场得了客户的认可，有很多国有大银行的订单，口碑非常不错。

其实，每一个产品所在的领域，都是一个相对独立的市场。我考虑的是，如何确保这个产品模块的团队，做到行业数一数二。

比如“零信任”产品，是否已经做到国内客户最认可？再比如音视频，虽然我们连续好几年在国内排名第一，但面对新场景不断冒出的机会，我们的团队有没有抓住？团队的小伙伴，也一直在往这个方向努力，像音视频，最早是服务泛娱乐直播场景，到现在是远程会议场景，最近两年，又有很多新的产业场景，比如矿山里的无人矿车、集装箱码头的无人集卡，都有用到我们的音视频技术。

记者：把指标拆开看，反映了腾讯非常“务实”的一面，这一点在AI布局上似乎也能看到。比如当初，咱们没有跟风去抢发一个通用大模型，而是立足产业，率先推出了“行业大模型”，能否具体谈谈，咱们在AI尤其是大模型上的布局思考？

汤道生：AI在今年确实很热，客户需求很强。不仅仅是大语言模型，而是所有AI相关的能力，比如机器视觉、语音识别、数智人等等，都特别感兴趣。我们其实一直持续在AI上加大投入，从研究算法到服务客户的场景需求，全面地布局。

很多人都喜欢从TO C的角度，去关注和使用通用大模型，比如，很多人花很大的精力去测试，让一些通用大模型去“胡言乱语”，而不是把它用在产业上。

我觉得对于大模型，最务实的做法，还是回到每个企业自身的痛点，比如降本或者增效，基于痛点，用大模型去解决产业实际问题。可能刚开始使用的版本，只能解决问题的80%，但因为你有一个很清晰的使用场景，用户的反馈，能够形成反哺，帮助你不断打磨模型性能，让解决问题的准确率，一步一步地提高。

正是基于这样的考虑，我们从几个方面，帮助产业，真正把大模型的能力用起来。

首先是打造高性能的AI基础设施。海量大数据处理，模型的训练、推理、部署和运维，以及智能化应用开发、调试等等，都离不开高性能的计算、存储和网络通信能力。

所以我们打造了高性能计算集群HCC、高性能网络星脉、向量数据库等产品，能够帮助客户快速、低成本构建大模型和智能应用。

二是提供多元化的模型选择和精调解决方案。随着大模型的产业落地，大家更关注如何寻找与自身业务更匹配的模型底座，训练出符合自身需求的专属模型，为此我们推出了腾讯云MaaS服务，打造“行业大模型精选商店”和精调解决方案。

今年大会的主论坛中，我们正式亮相了腾讯自研通用大模型——混元，它有超千亿参数规模，预训练语料超2万亿tokens，有强大的中文理解与创作能力、逻辑推理能力，以及可靠的任务执行能力，经过腾讯内部的很多产品中验证，效果不错。企业可以通过API调用混元，或者将混元作为基底模型，为不同产业场景构建大模型应用。

混元之外，在腾讯云行业大模型精选商店中，我们还上架了20多种行业最新、最流行的开源大模型，以及20多个领域的行业大模型。企业可以根据需要，选择合适的模型，然后借助腾讯云智能的TI平台，导入企业专有数据，做进一步的训练与精调，快速生成更有针对性的专属大模型，满足企业个性化需求。

三是推出一系列智能化的应用，推动业务全链条智能。我们基于大模型打造了全栈产品体系，应用于业务不同环节，帮助企业全链条提质增效。比如金融行业，大模型的能力已经应用在开户、业务处理、风控、售后客服等多个业务场景。

客户服务中，专属大模型与数智人的结合，几分钟就可以完成一次在线开户；在海量单据处理中，基于大语言模型能力TI- OCR，通过少量标注样本，就可以识别回单、发票、申请书等多种表单，准确率超过95%，而且还能自动提炼核心标签，生成电子数据文件，进行后续的商业分析。

借助金融风控大模型，金融机构通过小样本提示，就可以自动生成专属的反欺诈模型，建模整个流程时间从2周减少到2天，整体反欺诈效果也提升了20%左右。

记者：您觉得，通用大语言模型未来最有潜力的应用场景是什么？腾讯云的行业大模型，会重点选择某些行业吗？比如像你刚刚提到的金融行业。

汤道生：大语言模型的核心是自然语言处理，语言一般首先是用在跟用户有沟通、交流的场景中，比如客服、售后。通过大语言模型，能够实现降本增效，或者提升用户体验。所以，跟用户打交道比较多的场景，大语言模型能发挥价值的地方也更多。还比如文生图的能力，可以用在需要频繁做图的场景，比如广告投放、营销等等，但也不是所有的行业，都需要做在线投放和营销，还需要对行业和客户做进一步筛选。

其实，各行各业对大模型普遍都很感兴趣，都在各自探索创新的落地方式。比如医疗领域，腾讯健康积累了很多健康领域的知识，给超过1000家医院去提供AI导辅诊的能力，为患者提供更准确的咨询、更详尽的解答。

刚才跟一个客户交流，他们非常感兴趣怎么通过医疗行业大模型来服务聋哑群体。融合大语言模型、数智人、机器视觉技术，就能把语音沟通变成手语沟通，帮助患者解答健康问题。

通过这些案例可以看到，大模型的产业应用，可能不一定是天马行空、很“嗨”的场景，也许就是怎么让售后服务高效，能更快解答客户的疑问，虽然朴实但有用。

我们自己就比较喜欢基于自身的业务场景去构造产品，打磨产品，达到满意的效果，然后把产品开放出来，给行业客户去用。

比如我在会上分享的乐享，它也是我们内部知识库社区，CSIG上万人中，大量一线人员都是通过这个平台，了解产品的最新功能，反馈问题，让产品不断去补齐能力；产品人员也可以把经典的客户案例、产品QA放在上面，方便一线销售人员去应对客户咨询和提问，信息非常丰富。

但是以前，员工想要从这么大体量的知识库里，找到想要的信息，不是那么容易的。所以，我们基于行业大模型，打造了AI助手，用户通过自然语言提问，就能快速从繁杂多样的资料中，快速找到想要的信息，效率非常高。

这个过程中，也会面对大量数据的存储、查询等突出问题，我们通过向量数据库，把非结构化的数据，有序地存储以及快速检索，很好地解决了这个难点。

不只是乐享，当年我们做腾讯会议，也是觉得原来的会议软件不好用。如今，我们又在腾讯会议中上线了AI小助手，能够实现会议内容自动摘要、会管会控；还有客服场景，我们也非常关注，重点打造了腾讯企点智能客服这个产品，借助大模型，我们把产品和服务的相关资料输进系统，给到客服人员，他们给企业提供售后和服务时，就能够快速找到答案，更高效地完成一个工单。这些场景，其实都很实在。

过去四个月，我们不断地通过大模型，去升级腾讯云的所有产品，基于自身的场景，打磨产品，很多客户对于腾讯云产品的这些新能力都非常感兴趣，也觉得很实在。

记者：在激烈的市场竞争中，腾讯的行业大模型上有哪些突出的差异化优势？基于这些优势，行业大模型会我们带来哪些商业上回报？

汤道生：我们更多关注的是，让很多行业客户去使用，看看到底怎么用好大模型的能力，去解决具体的问题。也不仅仅关注模型本身，还包括，如何帮助客户用好本身已有的数据，这些数据可能都不是公开的，但却是在企业自身的业务场景里，回答某些问题时所必须的。

用好数据的过程中，会涉及到模型的训练、精调、数据标签的管理等工作，同时要降低模型的使用成本，还需要做训练加速的工作。

所以，从一个大模型，到提供一个用户可以感受到的服务，中间有很多的环节和工序。腾讯其实是提供，整个端到端的AI服务流程中所需要的“全链条工具”。我们的TI平台就是一个能满足整个工序、环节的需求，给客户提供高效模型搭建服务的重要工具。这可能是大家比较少从友商那里听到的。

至于商业化，现在谈这个可能有点早，但很多机会是能够看到的，比如训练需要非常大的算力，今天的计算成本很高，会带来一定收入。另外，模型搭建和精调过程中，要用到的工具，形成客户依赖，长期来看，也会建立起一个可持续的商业模式。

记者：听您介绍说，混元在腾讯内部已经有超过50个业务场景中有应用，未来公司管理层对于腾讯内部业务，接入混元的态度，更会类似于业务全面上云、统一动作，还是说，业务可以自主选择是否做接入？

汤道生：我们的内部管理相对比较开放。很多场景、产品都在使用大模型，方式也比较多样。他们接入了混元，但同时也会针对业务自身的场景数据，做一些定制化的模型开发和精调。

腾讯做大模型，既有整合力量办大事的地方，比如说混元，公司只会有一个，因为它有非常高的投入，也需要非常专业的人才、资源来支持。但是针对不同的产品场景，其实需求差异蛮大的，我们会允许不同的应用，去选择最符合客户需求的一些模型，重点是每一个产品是不是能够给用户，提供最好的体验。

比如，腾讯会议其实在早期，也尝试接入了第三方的模型，跑通整个业务流程。有些甚至就是在客户自己的开源模型上，基于企业数据构建一个专属模型，来对接腾讯会议。

对内我们保持开放，对外也是一样。今年6月，我们在行业大模型技术交流会上就说，不同行业、不同场景的需求很不一样，可能需要不同的模型，有针对性地提供支持，需要有多样化的模型选择。我们既给客户提供混元大模型这样一个底座，也把几十个开源模型，放在腾讯云智能的大模型商店里，提供给客户使用。

开放，其实是我们做To B业务的一个非常重要的价值观。不只是大模型，包括像数据库，也有很多细分类目，这么多年，大家一直在用不同的数据库，解决不同的问题。我们的TDSQL在TPC-C打榜拿到了世界冠军，解决的是海量高并发场景下在线交易的问题，如果用AP分析型数据库，可能就无法解决。

前一阵，我们也发布了针对大模型场景下，满足客户需求的向量数据库，解决的是企业使用大模型前需要处理的数据清洗、处理等问题。

我一直觉得，要比较务实地看待技术，什么问题适合用什么技术、什么方式来解决，就去给用户提供合适的工具。而不是说你手上有一个锤子，看到什么都是钉子，只有一招。这不是CSIG用技术解决产业问题的理念。

记者：最后想问的是，大模型发展初期，需要不断试错，技术成型可能需要十年或者几年的长度，我们一方面要降本增效，另一方面又要去做这样的长期投入，这么去平衡？

汤道生：资源分配需要有节奏，我有一个“721”的管理理念，70%的资源投入在当期收入和利润上，这样才能让团队生存；20%投入在发展中期的技术，这种技术可能再多两年，就会有商业化变现，可以作为增补项来补充成熟业务；最后的10%，是投在仍处于发展早期的前沿技术，是面向未来的机会布局，可能要三五年甚至更久才能带来商业回报。对于腾讯这样的公司来说，我觉得这样的规划是比较合理的。

AI将会是我们的一项长期的、战略性的投入，因为我们非常看好它的未来。就像90年代互联网，作为新技术，大家也有很高的期望，但也经历2000年的泡沫破灭，这并不代表互联网技术就没有价值。后来，随着PC互联网的发展，互联网能连接很多数据、设备，兴起一波浪潮，腾讯也是获益的企业之一。再到移动互联网时代，能连的设备更多了，终端的能力也更强了，又迎来一次新的爆发。

我觉得AI技术也是这样一个发展模式，早期的AI能力能在部分场景，解决部分问题，但是每一次的技术升级、能力进步，又会打开更多新的机会，AI未来还会有更多能力的提升，我们非常看好，也会持续投入。

排版 | 星辰

编辑 | 星辰 轮值主编 | 夏昆

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章