Redian新闻
>
汤道生的下一场战事:大模型时代的产业「智能化」升级战怎么打?

汤道生的下一场战事:大模型时代的产业「智能化」升级战怎么打?

科技
机器之心原创
作者:张倩
汤道生谈大模型时代产业「智能化」打法:直奔主题、跑「马拉松」、保持开放。
2023 年上半年,百模大战如火如荼,成了国内 AI 领域最热门的讨论话题。但相比之下,腾讯显得有些低调。在战况最激烈的 4、5 月份,腾讯没有向外界发布任何信息。在 5 月份的 2023 腾讯股东大会上,甚至有人忍不住问马化腾,腾讯是不是在憋什么大招?

某种意义上来说,腾讯确实在憋「大招」。但这个「大招」和过去几个月各大公司密集发布的大模型有所不同。在和大模型相关的所有消息中,腾讯都在强调「产业」,而不是 C 端的「chat」场景。就连最受关注的通用「混元大模型」都是在以产业互联网为背景的「腾讯全球数字生态大会」上亮相的,与之相关的 Maas 行业大模型解决方案更是多次被重点阐述。可以说,腾讯的大模型服务从一开始走的就是一条产业化的路径。

为什么要走这条路?腾讯集团高级执行副总裁、云与智慧产业事业群(CSIG)CEO 汤道生道出了他在这波大模型浪潮中观察到的一个普遍现象,「面对 AI 的发展,很多企业家和从业者,一方面觉得很兴奋,迫不及待地想要拥抱大模型技术;但另一方面也很焦虑,不知道从何做起。」于是,回应这种焦虑成了腾讯云在这波「百模大战」中的首要任务,这和腾讯云 5 年来一直践行的「产业互联网战略」一脉相承。

正如汤道生所说,伴随着大语言模型的发展,产业和社会正在从云化、数字化,走向智能化,这是一步一个脚印的过程。其间,腾讯云扮演了关键的基础设施角色。通过帮助企业上云,腾讯云为企业带来了更高的灵活性、可扩展性和更低的运营成本。在云化已经取得阶段性成果的基础上,企业对于智能化的需求日益迫切,作为重要基础设施并积累了丰富经验的腾讯云自然也迎来了新的历史使命。在这样一个节点上,腾讯云将如何借助大模型等工具,帮助企业打好「智能化」这场战役成了一个备受关注的问题。

在刚刚召开的以「智变加速,产业焕新」为主题的 2023 腾讯全球数字生态大会上,汤道生分享了腾讯云对于这一问题的思考。


做大模型,腾讯云「直奔主题」,
主打「务实」

「我和孩子都是历史人文爱好者,端午想去苏州,请推荐预算 5000 以内的行程规划,需要每天去 2 个不同的景点玩。」这是 6 月 19 日,腾讯云在「行业大模型及智能应用技术峰会」上向自家文旅行业大模型抛出的一个考题。

令人眼前一亮的是,这个大模型不仅像其他通用大模型一样列出了可以去的景点,还给出了每天的交通、景点、住宿安排以及对应的价格和链接,远远超出在场观众期待。在这个演示的视频号评论区,有客户次日就找上了门,问「有需求怎么联系你们?」或许,这就是「务实」的力量。


「大家都喜欢从 to C 的角度,去关注和使用通用大模型,关注点可能会有些走偏。我们更愿意直奔主题,以比较务实的态度去解决问题。」在做大模型的路径上,汤道生表明了这样的态度。

所谓的「直奔主题」,可以理解为更加关注产业应用以及里面的具体问题,而不是那些「天马行空的看上去很『嗨』的场景」。在汤道生看来,前者「朴实而有用」。


而要解决这些问题,仅依靠某个通用大模型在现阶段肯定是不够的。因此在大模型的选择上,腾讯云并不「迷信」任何一个通用大模型,而是打造了一个「大模型商店」。这个商店既上架了腾讯的通用混元大模型,还上线了 20 多种行业最新、最流行的开源通用大模型,以及覆盖金融、文旅、零售、政务、医疗、教育等 20 多个领域的行业大模型。


重要的是,企业在选到合适的模型后,还可以利用自己的专有数据做进一步的训练与精调,快速生成更有针对性的专属大模型。

不过,这个环节有很多现实的问题,比如企业可能会担心腾讯云的数据处理能力是否强大、可靠、安全。面对这些挑战,腾讯云也显示出了务实的一面。

首先来看数据质量。众所周知,在深度学习领域,扩大模型规模和提高数据质量都是提高性能的有效方法。前段时间,微软的研究者发现,如果数据足够优质(达到教科书质量),13 亿参数的小模型可以媲美比它参数规模大几个数量级的模型。上海交通大学清源研究院和里海大学的一项研究也发现,如果从 3000 多条数据里选出 200 条高质量数据用来训练模型,在同样的配置下,后者性能会更好。所以,对于注重降本增效的产业界来说,提高数据质量是一个非常值得探索的方向。这恰恰也是腾讯云一直以来努力的方向,他们的 TI 平台内置了完备的数据清洗、标注、回流等套件,能够满足企业对于高质量数据和高速度「数据飞轮」的需求,让企业形成自己的竞争壁垒。

其次来看数据安全。在 ChatGPT 诞生之后的很长一段时间,很多大公司都禁止自己的员工使用这项工具,以防数据泄露。「用户数据一旦被泄漏,对企业经营可能造成重大的损失,对企业信誉带来长期负面的影响,」汤道生强调说。因此,腾讯云一直把数据安全作为一个重点问题来解决,多年来被权威市场分析机构评为这一领域的「领导者」和行业第一。也正因如此,腾讯云备受数据敏感型企业的青睐。据悉,腾讯安全已经服务了 80% 以上的金融行业客户、90% 以上的头部能源企业、80% 以上的头部车企。这也是「务实」的力量。


身处「百模大战」,腾讯云准备跑「马拉松」

前面提到,5 月份的时候,有人问过马化腾,为什么大家都在抢发大模型,腾讯却异常冷静?当时马化腾是这么回答的:「这是几百年不遇的、类似发明电的工业革命一样的机遇。对于工业革命来讲,早一个月把电灯泡拿出来在长的时间跨度上来看是不那么重要的。」

在采访中,汤道生也表达了类似的观点,指出大模型在产业互联网的落地是一场马拉松,这场马拉松可能以十年为单位,「现在可能才跑到一公里」。而在这样的初期阶段,腾讯云更希望做到的是稳扎稳打,而不是急于求成。

因此,在过去的几个月里,腾讯一直在内部持续打磨混元等大模型,包括借助「求真」算法降低模型幻觉,通过强化学习提升抗诱导能力等。不过,更重要的是,他们把自己重要的、丰富的业务场景当成了「磨刀石」,让混元大模型接入了 50 多个腾讯产品进行测试,包括有 4 亿用户的腾讯会议、覆盖 6 亿用户的腾讯广告等。在技术圈,这叫「吃自己的狗粮」,即自己的产品自己要用,把产品在内部打磨好再拿给产业客户。

为了让大家理解这个过程,汤道生举了一个「腾讯乐享」的例子。「腾讯乐享」是腾讯内部的一个知识库社区,沉淀了 150 万篇腾讯员工创作的各类技术、经营文档。之前,员工要想在这么大的体量的知识库里找到想要的信息非常不易。但是在接入基于行业大模型打造的 AI 助手后,他们用自然语言的形式去向模型提问就能得到想要的信息。此外,这个产品还考察了腾讯云的数据存储、查询能力,技术人员通过向量数据库,实现了非结构化数据的有序存储和快速检索,很好地解决了这个问题。等这些技术都通过内部考验后,腾讯云才会考虑将其推给客户。


除了对于模型的打磨,腾讯云决定打持久战的另一个表现是对 AI 服务流程所需的全链路工具的重视。他们的 TI 平台覆盖了从数据获取、数据处理、算法构建、模型训练、模型评估、模型部署到 AI 应用开发的「产业 + AI」落地全流程链路。这是一个找到痛点,各个击破的过程。整个平台构建起来需要数年的时间,后续的打磨更是需要花费很多精力。但腾讯云一直在有条不紊地迭代,一个问题一个问题去解决。

在喧嚣的「百模大战中」,这种自上而下稳扎稳打的风格和打持久战的决心折射出了一种难得的清醒,也让人感觉更加踏实。

面对挑战,腾讯云保持「开放」

回到开头的产业「智能化」命题。随着 AI 技术的不断发展进化,我们其实是离这个命题越来越近的。但又因为这个命题太大,任何一家公司在为之努力时都会发现自身的局限,腾讯云也不例外。在汤道生看来,要克服这些局限,最重要的原则就是要保持「开放」。

这种「开放」性在腾讯云对待大模型的态度上体现得非常明显。他们的模型商店不仅上线了自己的大模型,还上线了很多开源大模型。因为在汤道生看来,在解决具体问题时,只要是技术能力和场景相贴合就可以了。「如果客户希望用他想要的模型,接入腾讯会议,实现智能化功能,我们也是开放欢迎的,」汤道生举例说。

这种对待大模型的开放态度折射出的是腾讯云现在做产业互联网所秉持的风格。在过去几年里,腾讯云经历了一段转型,从最初承载大集成类项目为主转向了更为开放、聚焦的「被集成者」角色。在这个过程中,他们发现,自己的强项其实在于长期以来积累的技术和产品能力。利用这些能力把底座做好,然后以被集成的方式去跟更多的合作伙伴合作对于腾讯云来说是更加可持续的。

「客户所处的行业是很专业的,腾讯也未必这么熟悉客户所处的这些行业,也没必要装我们懂,」汤道生坦言。因此,在打磨好自己的技术、产品的基础上,很多时候,腾讯云更依赖合作伙伴去服务客户。

「比如金融行业有挺多很专业的应用,我们并不是那么懂,但是他们可能同时有数据库的需求。我们可以很负责任地给他们提供一个高性能、高可靠的数据库产品,这也是腾讯云在自身业务中多年锻炼出的一些平台产品和技术能力。有些客户可能也有一些服务商为他们提供 DBA(数据库管理员,Database Administrator)服务,我们没必要再去干 DBA 的工作,反过来我们很愿意跟这些服务商进行合作,帮助他们熟悉我们的产品,提供支持、培训,让他们能够成为服务客户的一线伙伴。」汤道生举例说。

这条开放的「被集成」路线在腾讯云内部贯彻得非常彻底,而且汤道生说自己「从来没有犹豫过要不要走回头路」。

当然,与人合作的前提必须是自己的技术、产品够硬。所以我们才看到腾讯在大模型相关的每一次发布中都相当谨慎,因为汤道生要确保负责每个产品模块的团队都能在行业里做到数一数二

这种开放的做事方式创造了一种双赢的局面:不仅让腾讯云的业务毛利实现了增长,也让合作伙伴利润大增。去年,生态伙伴收入占到腾讯云整体收入的三分之一,收入增速是腾讯云增速的 4 倍。对于「智能化」这一复杂的长期愿景来讲,这是一个非常正向的循环。


「未来,随着很多企业逐步迈向智能化,AI 的应用从老百姓的吃喝玩乐、衣食住行,到企业工厂的生产、销售、服务、办公都会覆盖,场景足够宽广。不会有一家公司能够包揽全部工作,因此 AI 生态也特别需要合作开放。」汤道生说。

未来,他希望以持续稳定的合作规则,让伙伴与腾讯的合作分工更清晰、投入更有积累、收益更可预期,与伙伴一起共建产业智能未来。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
图灵奖得主姚期智:大模型有无限的产业应用前景,能影响各个行业盘古大模型之外,华为首秀大模型时代「硬实力」腾讯汤道生:大模型,方向比速度更重要Byzer,一种大模型时代的SQL 编程语言|QCon最近一段时间我惨遭歧视!知识产权、隐私和技术滥用:如何面对大模型时代的法律与伦理挑战?大模型时代,如何搭建数据的“智能化流水线” ?|甲子光年黄学东:大模型时代需要注重「三个臭皮匠」的联合能力丨GAIR 2023QCon北京2023 参会见闻:大模型时代的技术人成长跑步者眼中的夕阳 (The Sunset in A Runner’s Eyes)《一念如初》&《牵手爱》大模型时代,如何评估人工智能与人类智能?这,就是大模型时代的生产力AI的大模型时代 ≠ 只有大模型的AI时代WAIC 2023 | 百度吴华:大模型时代的 AI 原生研发模式梅花创投吴世春:如果大模型时代的“张一鸣”很贵,我肯定不投中东加入混战,这场仗,中国该怎么打?华为提出全面智能化战略,加速千行万业的智能化转型Pride 里的男性自卑和自尊大模型时代的程序员:不会用AIGC编程,未来5年将被淘汰?如何快速实现大模型落地?5小时get大模型时代实战密码!亿铸科技熊大鹏:大模型时代,AI大算力芯片急需破除“存储墙”丨GACS 2023CCF CED 2023完整日程公布!10月21日,一起探讨大模型时代的工程师文化沈向洋周明杨格大模型激辩:继续爆堆参数,大模型能出现新的「智能涌现」吗?大模型时代的乔布斯怎么还没来旧文明的社会组织(第三章摘要)曹晟:大模型时代,跨境电商如何用AI提高广告转化?丨GAIR 2023文勇刚:大模型时代,我们需要怎样的数据中心?丨GAIR 2023大智能时代的产业再分工:“无数据,不智能”可以休矣严睿:大模型时代下的对话式 AI 发展丨GAIR 2023通用大模型转向行业大模型:腾讯云、华为云们的下一个战场大模型时代的人机关系:不要温和地走进与AI共生的时代路特斯机器人CEO李博:大模型时代的智能驾驶生产力工厂观点 | 杨东:大模型时代更需加强企业用户信息保护大模型战事中场:AIGC时代的企业,如何用AI原生应用乘风破浪?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。