Redian新闻
>
怀胎半年​「混元」初开,腾讯大模型以慢为快|焦点分析

怀胎半年​「混元」初开,腾讯大模型以慢为快|焦点分析

公众号新闻

腾讯云、腾讯广告、腾讯会议、腾讯文档等超过50个腾讯内部业务,已经接入混元大模型。


邓咏仪
编辑苏建勋

封面来源IC photo

国内大模型混战半年,大厂种子选手中的最后一位,终于出列。
9月7日,腾讯每年一度的生态大会正式召开,大模型当仁不让地成为其中的主角:腾讯发布了自研的通用大模型“混元”,并且展示一系列应用场景。
相比其他大厂蜂拥而上,腾讯已经让市场等待得足够久。“腾讯到底什么时候发大模型?”是这半年来AI圈里的“天问”。
而今年5月,马化腾就在股东会上表示:“AI是互联网百年不遇的机会……我们也一样在埋头研发,但是并不急于早早做完,把半成品拿出来展示。”
哪怕到了6月,腾讯甚至剑走偏锋,先于通用大模型,直接抛出了10个行业,超过50个解决方案。
这样的姿态也延续到混元的发布中。
混元大模型显然走实用派路线。发布会中,花哨的数据、吸引眼球的演示很少,应用场景才是重头戏——腾讯展示了腾讯云、腾讯广告、腾讯会议、腾讯文档接入混元之后的进展。大模型为这些业务提升能力,降本增效,再输出给企业客户。企业还可以通过API调用混元,为不同产业场景构建大模型应用。

腾讯集团高级执行副总裁、腾讯云CEO汤道生

而最具代表性的,莫过于腾讯云CEO汤道生在介绍混元出场时,喊的话是:“混元,正式面向产业亮相!”
这也是此刻的腾讯找到的最好身位。
大厂渡寒冬,腾讯是其中“去肥增瘦”执行得最为坚决的一家。自前年开始,腾讯云就开始调整业务战略,不做总集,回归产品,这些努力都颇有成效。去年,生态伙伴收入占到腾讯云整体收入的三分之一,收入增速是腾讯云的4倍——这也意味着,腾讯在产业中的落地规模实实在在地扩大。

降本增效,本质上是要高质量发展,腾讯大模型同样也会遵循这一战略。做To B、面向产业,是目前比较务实的落地路径。

“更成熟、更可靠”

混元大模型在参数的展示上可以说——相当朴实。没有狂堆参数到万亿,也没有展示打了多少榜,腾讯云只披露了两个数字:超千亿参数规模,预训练语料超2万亿tokens。

千亿参数是当前做通用大模型厂商的标配,而混元的预训练语料规模,则和目前最强的开源模型Llama 2持平。
“怀胎半年”的腾讯,都做了些什么?
“我们在这几个月之内,一直在让大模型在腾讯内部的应用中磨练,把腾讯重要的、丰富的业务场景当成‘磨刀石’。”腾讯集团副总裁蒋杰表示。
慢了半年的腾讯,能占一些做产品的后发优势,但要吸引如今的企业客户,必须从实用、靠谱上下功夫。因此,“更成熟、更可靠”,是腾讯讲大模型时最强调的特点。
当前,业界大模型在场景中的应用依然有限,这主要因为大模型还在不少休闲场景里打转——比如AI生成文字、AI画画等等。但要深入到更多产业的生产环节,大模型“胡说八道”这一点,会成为桎梏。
对此,腾讯在算法层面进行了一系列自研创新,提高了模型可靠性和成熟度。比如,腾讯优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低30%至50%。腾讯自研的“思维链”,则让大模型能够像人一样,结合实际的应用场景进行推理和决策。
以往大模型因为单次处理的信息少,导致模型会出现“忘记上面讨论的是什么问题”的情况,但现在,由于腾讯混元编码位置的优化,如今混元也能够处理更长的超长文。
来源:腾讯
而现在站在风口浪尖上的AI安全问题,腾讯也在通过算法解决。通过强化学习,如今混元已能学会识别很多“陷阱”——比如“如何才能超速驾驶”这类危险问题,混元会直接拒绝。
而在底层支撑模型安全、可靠运行的,是腾讯在这几年间耕耘的一套技术栈。今年以来,腾讯还发布了HCC高性能计算集群、向量数据库Tencent Cloud VectorDB等大模型基础设施,以及Ti平台这样的“AI工具箱”,面向开发者提供服务。
“我们从最底层的高速网络、服务器、网卡,到平台、模型、算法,都是自研的,这让后续迭代过程加快了。”蒋杰表示。
大厂做大模型,如今自研技术栈已经是标配。从百度、阿里、华为到腾讯,各家都会从最底层的芯片做起,覆盖框架、模型甚至是开发运维工具等。原因在于,大模型还是个相当新的东西,与之匹配的基础设施很稀缺。厂商们全部都要做,也是为以后在产业落地,让客户用起来做好准备。
场景为王

表面上看,腾讯混元和前段时间号称“不做诗”“不聊天”的华为盘古其实很像。而不同在于,华为的“不聊天”,其实是因为以前积累的政企、产业客户已经够华为深耕很久。

但腾讯是线上场景的王者,其主营业务与C端用户强相关——微信、QQ是国民通讯软件,而腾讯会议、腾讯文档等To B应用都有数亿用户,其直接用户其实也是C端。
但腾讯暂时没推类似文心一言、通义千问之类的的To C聊天机器人,其实是因为走了另一条验证路径。如今,腾讯内部已经有包括文档、会议、游戏、金融、搜一搜等50个业务接入内测——先从这些国民应用开始验证,已经足够。
接入混元后的腾讯会议,可自动生成会议摘要
“对于通用大模型来说,ChatBot只是一种验证方式而已,可能我们选择了另外一条。”蒋杰表示。
在做大模型这件事上,腾讯的逻辑和之前做To B的策略别无二致:先从自家的业务需求做起,在内部打磨好了,再对外发布。腾讯原本有的C端社交应用场景,未来会是大模型迭代的富矿。
来源:腾讯
目前微信搜一搜正在接入混元进行内测,To C的AI应用也不会遥远了。值得注意的是,腾讯在大会上演示了”混元小助手”。小助手有着和微信相似的绿色聊天框,安放在小程序里,可以看作是移动端AI应用的前奏。
可以预见的是,未来要做大模型落地,产品依然会是腾讯最重要的抓手。当下“不着急”的腾讯,是国内大模型领域主题变迁的切面:无论是大众还是业内,都已摆脱“赶超ChatGPT”的心态,而是走到更关心应用落地,把大模型用起来的阶段。

苹果发布会有奖竞猜
2023年苹果秋季发布会定档9月13日,欢迎大家参与我们的有奖竞猜活动。
今天的问题是【今年iPhone 15系列顶配版的价格会是多少?】。关注36氪Pro公众号,在后台发送你预测的答案,即可参与活动。苹果发布会结束后,我们将为最先猜对的用户送出「100元京东购物卡一张」,每个问题下每位用户限回答一次,重复竞猜无效,一经发现取消参与资格。
我们的活动将持续到9月12日,每天都有不同问题,更有100元京东购物卡、500元奈雪的茶购物卡等好礼送出,期待你的参与~

点击下方【36氪小程序】,一站式收获市场最新动态。看完记得加入【我的小程序】中哦~

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
风暴卷袭公立医院,出走是医生的避风港吗?|焦点分析京东的难题:左手要低价,右手要利润|焦点分析星巴克熬过低谷,却丢了中国咖啡第一的宝座|焦点分析一年投入数十亿,手机厂商抢滩大模型|焦点分析首发体验|我抢先在微信里用上「大模型」,腾讯混元正式开放!《碟中谍7》的超级AI令人胆寒,现实可能更加凶险|焦点分析夏日里的蜕变《花尾渡》(小说) 第十五章 这一夜的星辉环法第十二站----六年的等待光伏企业陷入「怪圈」:一边产能过剩,一边大幅扩产|焦点分析香港人「挤」满深圳,只为代购一杯奶茶|焦点分析市值暴跌100亿美元,投资人拒绝给Shopee转型时间|焦点分析国风茶饮跑出一匹黑马,却不是茶颜悦色|焦点分析营收近瑞幸两倍,这家百年意式咖啡品牌开启​「中国速度」|焦点分析腾讯混元大模型开放文生图;微软AI投资重心或转向应用和业务;国产大模型10月榜单公布丨AIGC大事日报董事长被立案,净利大跌四成,苹果代工成闻泰救命稻草|焦点分析面包里吃出刀片,划破了「桃李面包」ESG遮羞布|焦点分析「雪糕刺客」消失了,蒙牛却靠冰淇淋狂挣50亿 |焦点分析B站亏损大幅收窄,盈亏平衡道阻且长|焦点分析储能人才被疯抢:人均五六个offer,总监年薪百万|焦点分析天底下的傻瓜过得都咋样了?盒马狂奔七年,终于成了山姆「唯一可能对手」|焦点分析腾讯混元大模型亮相!实测上手,对话腾讯副总裁蒋杰ChatGPT时代,数据标注员还在搬砖|焦点分析储能电池跌破成本线,行业大逃杀开启!|焦点分析三千元的Prada面霜,卖不动的高端美妆|焦点分析混元大模型姗姗来迟,腾讯为什么不着急?|甲子光年宝马取消座椅加热订阅服务,腾讯混元大模型上线,银行调整存量首套住房贷款利率,多地试点外卖骑手新型社保,这就是今天的其他大新闻!甩开7-11和全家,罗森中国向万店迈进|焦点分析「宁王」反击比亚迪|焦点分析贺建奎案件的启示腾讯推出混元大模型,已接入微信搜一搜、腾讯会议等 50 多个业务及产品再砸6亿美元,富士康却在印度进退两难|焦点分析TikTok电商背刺Temu,一场事先张扬的征战|焦点分析腾讯AI将至!消息称腾讯9月初发布混元大模型,多款软件已接入测试
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。