Redian新闻
>
腾讯大模型交卷:不追求参数,走实用路线|甲子光年

腾讯大模型交卷:不追求参数,走实用路线|甲子光年

科技

没有发布对话机器人。


作者|武静静

编辑|赵健


千呼万唤始出来,6月19日下午,腾讯云的大模型终于露面。


神秘的面纱只揭开了一半。本次发布会由CSIG(云与智慧产业事业群)主导,并没有发布像ChatGPT、文心一言这样的大模型对话机器人,而是把重点放在了与腾讯云结合的行业大模型。


目前,云厂商在大模型的产业落地思路上基本已达成共识:MaaS(Model-as-a-Service)模式,落地行业,和客户一起合作做垂类大模型。这也是腾讯云的行业大模型总体思路。


腾讯云分享了行业大模型的整套系统架构:基于TI平台打造行业精选模型商店,面向金融、文旅、政务、传媒、教育等10大行业,提供超过50个解决方案。此外,腾讯云还公布了行业大模型在腾讯企点(腾讯的CRM产品)、腾讯会议、腾讯云AI代码助手等SaaS产品中的应用进展。


距离ChatGPT发布已经过去半年多,各种大模型也层出不穷。在腾讯这场发布会上,行业大模型的整体架构和落地方向上,并没有太多惊艳的地方。


马化腾此前在财报会上说:“大模型是互联网百年不遇的机会,是类似发明电的工业革命一样的机遇,腾讯并不急于把半成品拿出来展示,关键还是要把底层的算法、算力和数据扎扎实实做好,而且更关键的是场景落地。”


现在看起来,腾讯大模型的特点正如马化腾所总结的那样,更加地务实。




1.汤道生:通用大模型不一定是最优解


眼下,在落地上,国内公司已经达成共识:通用大模型不是唯一解,通用大模型和垂类大模型已经不再是选择题,很多大模型公司都在同步探索两个方向。


这个共识主要出于大模型落地的现实性考量。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生也提到了通用大语言模型在应对产业场景落地时存在一定的局限性:“企业需要的是在实际场景中真正解决了某个问题,而不是在100个场景中解决了70%-80%的问题。而通用大模型的训练数据主要来自公开数据集或网络数据,对于特定行业的专业领域知识了解有限;通用大语言模型的训练需要大量计算资源和漫长的训练周期,对企业而言昂贵且耗时;安全和合规是企业的必要考量因素。”


他提到,“通用大模型不一定是满足行业场景需求的最优解。企业需要有针对性的行业大模型,结合自己的数据做训练或精调,在合理的成本下,打造实用性更高的智能服务。”


这是腾讯云做行业大模型时看到的机会和价值。围绕这一思路,腾讯云推出了一站式的行业大模型精选商店。腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声分享了整体产品架构:“依托腾讯云大模型高性能计算集群和行业大模型能力,我们通过腾讯云TI平台,面向客户全面输出MaaS能力,可以满足客户模型预训练、模型精调、智能应用开发等多样化需求。”


他透露,目前,腾讯云已经携手传媒、文旅、金融、政务、教育等行业的头部企业,在十余个行业探索了超50个行业大模型的应用解决方案。



我们可以看到,此次,从算法技术、工具到产品,腾讯云都进行了全新的升级,其推出的行业大模型主要架构分为三层:


技术底座层包含算力工具和行业模型。算力方面,包含腾讯云今年4月发布的专为大模型训练设计的新一代HCC高性能计算集群;依托自用的向量引擎(OLAMA)腾讯云也即将推出向量数据库(Tencent Cloud VectorDB);以及自研的星脉计算网络架构。模型方面,包含各类的行业大模型基础设施。


平台层的核心是腾讯此前就进行过多次迭代升级的机器学习平台——腾讯云TI平台,这是腾讯云大模型能力在行业落地的技术“杀手锏”。结合大模型技术,TI平台此次进行了新的升级:除了包含此前就有的数据标注、训练、评估、测试和部署等工具,还有升级后的“太极Angel”,可以进行更优训练和推理加速,同时也包括了从“业务分析、数据处理、大模型选择”到“模型评测”的一体化完整方法论。



吴运声提到,腾讯云TI平台可以实现针对行业场景的低成本落地,比如智能客服场景,训练性能可提升10倍,训练成本下降90%。


最上层的MaaS就是针对具体的产品和行业推出的具体解决方案,除了包含行业大模型精调解决方案,还有针对细分领域的模型训练平台、各种应用平台以及具体的智能应用。以腾讯云数智人工厂为例,腾讯云MaaS能力可以让数智人分身复刻缩短至24小时,大幅降低成本。此外,在文旅领域推出的文旅大模型,金融领域打造的OCR大模型都是已经在落地的案例。



该“文旅大模型”的现场演示是本次活动的亮点之一,我们看到,其中的机器人对话产品可以根据提出的问题,给出详细的旅游攻略;还可以自动调用相应的API,直接给出了酒店和车票的预定链接。


吴运声也重点强调了腾讯大模型的安全能力,这也是当下很多大模型在重点补齐的能力。他说:“我们在问题侧、模型侧、答案侧三个层面进行敏感信息的过滤和规避。同时,依托腾讯多年的安全经验和天御风控能力,提供AIGC全链路内容合规解决方案,确保大模型可信、可靠、可用。”



除了对外和客户一起共建行业大模型之外,腾讯云公布了行业大模型能力在腾讯企点、腾讯会议、腾讯云AI代码助手等内部产品中的应用:


  • 腾讯企点推出了新一代智能客服和企点分析AI助手,可以快速根据提问生成数据和结果,也可以进行智能化的数据采集、治理、分析。


  • 腾讯会议宣布即将推出AI小助手,可以基于会议内容,进行快速分析,自动生成智能总结摘要,还能执行会管会控,进行智能录制。


  • 腾讯云也宣布将推出新一代AI代码助手,支持多种编程语言和主流开发框架、以及常用开发环境;覆盖开发关键流程,包括沟通、编码、排错、评审和调优。

这是本次活动的一个亮点,目前,国内的SaaS都在摸索大模型在产品中实践,腾讯在这个方面的应用算是给行业提供了一个实际落地的借鉴案例。



2.不关注模型参数,走实用路线


从此次新的行业大模型发布可以看出,腾讯云大模型当下走的是实用路线

这也是个腾讯大模型落地的总体思路,在会后的群访环节,吴运声强调了这一态度:“几亿、几十亿、几百亿还是一千多亿,我们并不关心模型参数的那个数字,我们更关注的怎么解决客户的问题,希望用最有效,最低成本的手段去解决客户的问题。”

“就像举重运动员要举200斤的杠铃,但作为游泳运动员举100斤就够了,作为体育室,我们提供200斤的杠铃,但对于不同类型的运动员或者更多普通人,他们没有必要都要用200斤的杠铃练习。”吴运声说道。

同理,在一些行业和具体的领域,数据量本身就没那么大,用小参数成本低,效果也会更好。“我们希望以最低的成本,最合适的模型,最好的服务去让客户真正把技术用起来,解决它在场景中的问题。”吴运声说。

除了行业大模型之外,更多人也在好奇,坐拥最大流量池的腾讯如何借助新的大模型技术操持全盘的产品全局。

腾讯的AI大模型技术最早探索可以追溯到2019年,当时马化腾对外表示,腾讯建立了四大AI实验室,涵盖AI从全面基础研究到多种应用开发。

2022年4月,腾讯首次对外披露旗下混元AI大模型的研发进展,这是一个包含CV、NLP、多模态内容理解、文案生成、文生视频等多个方向的超大规模AI智能模型。

2022年12月,腾讯推出了万亿中文NLP预训练模型HunYuan-NLP-1T(混元AI大模型),它在自然语言理解任务榜单CLUE中得分突破80.888分,获得第一,并刷新该榜单历史纪录。据了解,混元大模型已成功落地于腾讯广告、搜索、对话等内部产品并通过腾讯云服务外部客户。

2023年2月,据36氪报道,腾讯针对类ChatGPT对话式产品已成立“混元助手(HunyuanAide)”项目组,凝聚内部多个团队的能力。Owner为张正友,PM分别为俞栋、王迪、刘田,该项目有至少7位组长、7位Sponsor,TEG、PCG、CSIG都参与其中。对于这一消息,腾讯方面的回复是,目前,腾讯在相关方向上已有布局,专项研究也在有序推进。

目前,腾讯云之外,其他腾讯业务线上大模型的具体进展尚未正式披露,这也是腾讯一贯的风格。

除了产品层,腾讯也在紧锣密鼓地推进大模型领域的投资,根据小饭桌的报道,今年,腾讯已经先后参与投资了两家知名的大模型创业公司深言科技、MiniMax。



3.MaaS成云计算竞争新赛点


当前,云计算竞争趋于白热化,各个厂商都在想方设法寻求增长。大模型技术成为云厂商们手中争夺市场的新“武器”。此前,阿里百度华为都提出要把大模型技术落地到行业来吸引新的客户。

此次腾讯云发布的行业大模型无疑也是为了在云计算市场的竞争中多一份筹码。目前,腾讯云的市场压力不小,从市场份额来看,根据IDC发布的中国公有云服务市场2022下半年数据,在IaaS和IaaS+PaaS市场,腾讯云已经跌落到第四。此前从2014年开始,腾讯云一直是仅次于阿里云的第二大云服务商。

腾讯云貌似并不着急,这和腾讯云此前的战略转变有关。据媒体报道,2022年底,马化腾内部讲话说曾说:“我们不着急,千万不要上当”。他谈到,要全力支持放弃集成商角色,转而做自研产品被集成的战略。

「甲子光年」此前在《腾讯云成长的烦恼》文章中提到,腾讯云在2021年之后就调整了云业务战略方向:IaaSPaaS的发展重点从纯收入转向追求利润;SaaS被选为云业务的新发展方向,商业化成功是核心目标,节奏是优先扩大规模而非追求收入。

最新财报显示,第一季度,腾讯云所属的金融科技及企业服务业务收入487亿元,同比增长14%,毛利率显著提升。自从2020年,腾讯不再单独公布腾讯云的收入之后,具体腾讯云的收入和增长情况属于未知。据了解,当下,腾讯云在销售过程中,正在提高自研产品的销售占比,减少分包项目,以此提高销售的毛利。

面对焦灼的云市场竞争,腾讯走出了求利润的稳步路线。“我们是一家结构上更具成本意识、效率更高的公司,这应该有助于提高利润率。”腾讯称。

在第一季度的财报电话会上,腾讯谈到,公司在人工智能基础模型方面的进展良好,未来大公司都会有一个基础模型,并面对B端和C端用户推出。同时,许多创业公司将创造更多行业的垂类模型,并带来新的APP,腾讯各产品团队目前亦在着手设计一些有趣的产品。

如今垂类模型这个方向上,我们看到了腾讯云行业大模型的新动作,接下来还有哪些其他有趣的产品呢?让我们拭目以待。




END.




受微信改版影响,没有标星的朋友可能会错过「甲子光年」的推送或是看不到封面,欢迎各位新老朋友给「甲子光年」点个星标⭐️,以便及时收到我们的每篇新推文。


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
腾讯如何思考智慧交通解决方案?我们提问了两位技术负责人|甲子光年大模型时代,智能驾驶赛道需要怎样的AI芯片?|甲子光年华为云盘古大模型:下矿坑、测台风、进产线,没时间作诗|甲子光年“东数西算”工程面临新挑战,专家支招一体化存力建设|甲子光年Q1财报发布,阿里云、腾讯云、百度云谁更欢喜谁更愁?|甲子光年对话Moka李国兴:大模型改造SaaS需要持续渐进式创新,先发者把握先机|甲子光年大模型狂飙半年,掏出真金白银的投资人是少数|甲子光年​硅基智能司马华鹏:“百模大战”不争才是大争,不追风口我们造风口|甲子光年出海从0到1精炼实用教程,融云《社交泛娱乐出海作战地图》即将线下发布|甲子光年2023世界人工智能大会:大模型、机器人和AI芯片的试验场|甲子光年百度云MaaS升级:接入国内外33个大模型,进行二次性能增强|甲子光年OPPO造芯四年的悲情时刻,一场热潮的梦醒时分|甲子光年《傳奇》京东言犀大模型,离不开数智供应链|甲子光年【全文实录】张一甲:2023智能新世代,1个锚点与40个判断|甲子光年用“存算一体”底层创新,做高能效比国产化芯片|甲子光年容联云发布赤兔大模型,一次由内而外的自我重塑|甲子光年亚马逊、谷歌、微软,三大云巨头还没能从AI大模型中赚钱|甲子光年真心朋友​发布大模型PaLM 2,谷歌背水一战|甲子光年大模型追踪“杜苏芮”|甲子光年画你阅文发布首个网文行业大模型“阅文妙笔”,辅助网文创作、提效IP打造|甲子光年中国要崩溃, 从这里开始双林奇案录第三部之长命锁: 第五节十亿参数,一键瘦身!「模型减重」神器让大模型狂掉3/4 | 最“in”大模型英特尔发布中国定制版大模型专用芯片Gaudi2,用性价比挑战英伟达|甲子光年又一款能源大模型发布,为什么储能需要AI?|甲子光年2023专精特新云上创新指导手册|甲子光年智库百模大战拉开序幕,企业该怎么选大模型?|甲子光年卷入大模型,手机厂商的新叙事|甲子光年谷歌DeepMind发布机器人大模型RT-2,提高泛化与涌现能力|甲子光年诚邀您参与科技投资风向调研问卷填写【送甲子智库2022报告年度汇编】|甲子光年智库新能源电池材料发展概览报告|甲子光年智库融资千万,结盟软通动力,人大多模态大模型元乘象正在圈地大B市场|甲子光年
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。