Redian新闻
>
腾讯混元大模型亮相!实测上手,对话腾讯副总裁蒋杰

腾讯混元大模型亮相!实测上手,对话腾讯副总裁蒋杰

科技

大模型走向全社会,腾讯混元吹响集结号。
作者 |  三北
编辑 |  漠影
“今天我们非常高兴地告诉大家,腾讯自主研发通用大模型混元正式向产业亮相。”腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生今日宣布。在腾讯一年一度的全球数字生态大会上,腾讯自研大模型的神秘面纱终于揭开。
汤道生表示,混元大模型目前已有超千亿的参数规模、超2万亿Tokens的预训练语料,自即日起通过腾讯云对外全面开放。
与此同时,腾讯也一并带来了混元大模型“全家桶”的最新消息:腾讯云、腾讯广告、腾讯游戏、腾讯会议、腾讯文档等超过50个腾讯业务和产品,宣布已接入腾讯混元大模型测试,并取得初步效果。
随着“百模大战”在我国打响,大模型在场景中的实战检验效果成为产业关注焦点。腾讯本次交出了什么样的“答卷”?作为2018年起就不断传出大模型进展的科技公司,腾讯对大模型有什么样不同理解和布局?
智东西记者抵达腾讯全球数字生态大会现场,与腾讯集团副总裁蒋杰进行了深入对话,并上手实测了刚刚亮相的混元大模型,从而对上述问题的答案有了更深入了解。

▲腾讯集团副总裁蒋杰


01.
混元大模型亮相:不止聊天


训练烧钱,百模大战,大家的期待是什么?
一开场,蒋杰就从这个产业聚焦关注的话题引出话头:“我们希望用大模型提高人们的工作效率,让人们从容享受休闲的时光。然而,大模型在现实世界实际场景中应用非常有限。大模型在容错率高、任务简单的休闲场景已经可用,而在更有价值的严肃场景、工作场景、专业场景,都无法大面积地胜任。为了解锁这样的场景,大模型需要更加可靠,且更加成熟地在复杂场景中胜任更多任务。”
针对这一行业普遍难题,腾讯混元大模型从可靠性和成熟性两个维度解题。
首先,在可靠性方面,蒋杰称混元大模型有效降低了大语言模型“幻觉”比例,相比主流开源大模型降低30%至50%。所谓“幻觉”,简单说就是大模型“胡言乱语”。为了确保大模型的更加可靠,我们需要减少模型胡言乱语的现象。

不同于业界采取加搜索、增强知识图谱等“外挂”做法,蒋杰称,腾讯在预训练阶段采取“探真算法”进行事实修正。比如,让混元写一篇作文,尝试论证关羽和秦琼谁的战斗力更强,它并没有像市面上一些大模型一样将历史事件、人物、时间张冠李戴。 


▲混元减少“幻觉”的例子

其次,混元提升了抗诱导能力,面对安全诱导类问题的拒答率提升20%。这也加强了大模型的可靠性。
为了提升模型可靠性,腾讯通过深度的优化让模型学会识别陷阱的问题去抵制诱惑。在实际应用中,比如当用户提出一个问题:怎么样超速最安全?不同于其他大模型提出怎样超速的建议,混元则会拒绝回答了这样不安全的问题。这正是因为其在训练中,通过强化学习的方法,让模型对不安全问题说不。

▲混元抗诱导能力的例子

与此同时,在成熟性方面,混元大模型覆盖了短文本和千字级别长文本生成能力。当前市面上大模型在超长任务处理上很难实现。腾讯通过位置编码优化,提升长文的处理效果和性能,结合指令跟随优化,让产出内容更符合字数要求,从而提升超长文本的生成和续写能力。

▲混元撰写长文的例子

此外,腾讯混元大模型也提升了逻辑思考能力,支持结合实际场景推理决策。在大模型训练中,一些团队会让大模型通过“死记硬背”的方式学会中小学的数学题。但是在现实生活中,“背题”人人都行,还需要让大模型具备理解上下文的能力。腾讯推出思维链新策略,有效强化模型对问题拆解和分步思考的倾向。

▲混元逻辑推理能力的例子

可以看到,从行业痛点出发,腾讯正将混元大模型打造成一个具备强大的中文创作能力、复杂语境的逻辑推理能力、可靠的任务执行能力的通用大模型。
蒋杰称,混元经过了一系列的严格测评。在中国信通院的测评中,混元大模型在模型开发、模型能力这两项得到了当前的最高分;混元大模型在三大常见的测试集上表现非常强大。

▲混元通过多项主流测评

蒋杰指出,混元的目的不是在评测集上取得高分,而是要将技术运用到实践的场景,助行业去创新提效。

02.
实测混元:实用级大模型在手边
视频、文档都已接入


按照腾讯的战略定位,混元大模型是“从实践中来,到实践中去”的实用级大模型。
蒋杰透露了混元大模型产品化的最新进展:腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等超过50个腾讯业务和产品,已经接入腾讯混元大模型测试,并取得初步效果。
以腾讯会议结合应用为例,基于混元打造的AI小助手能实现会中问答、会议摘要、会议待办项等。比如当用户向AI小助手问道:“会议中黑客马拉松是什么意思?”AI助手便会自动整理相关知识,还包括与会人员关于这个话题的争论讨论。即便没能及时参加会议,用户也能获得关于会议的纪要和待办事项。

▲混元与视频会议应用结合

再以腾讯文档场景为例,基于混元大模型的智能助手功能支持数十种文本创作场景,用户可以一键生成标准格式文本,自然语言生成函数,基于表格内容生成图表等,这些功能都已在内测中。

▲混元与文档应用结合

在腾讯广告方面,混元大模型支持智能化广告素材创作,满足千人千面,实现文、图、视频自然融合。比如当用户需要生成一个关于踏青路线,且涉及亚洲女性在露营地的海报,当输入提示词后,便能得到AI生成的海报。据称这一应用实际采纳率超42%,远超过业界开源模型。

▲混元与腾讯广告应用结合

可以看到,无论是小程序,还是腾讯文档、视频会议等软件,这些都是人们日常手边会用的工具,如果它们全都接入AI大模型,那人们工作效率和社交体验将大大提高。
会后,智东西在第一时间亲身体验了小程序版的混元大模型,发现其在一些方面确实有提升。
如图所示,混元助手小程序页面风格与微信聊天框类似,设有聊天和灵感发现两框。在聊天栏,用户可以选择点击提示的问题进行提问,也可以自己输入提示词进行提问;在灵感发现栏,页面中有工作邮件、面试大纲、招聘信息、PPT大纲等更多功能化的模块。

▲小程序版混元大模型“腾讯混元助手”页面

智东西首先试了下混元的“幻觉”反应。比如,当给AI聊天机器人们挖个小坑问道:“蓝牙耳机坏了挂牙科还是耳科?”混元回答:“蓝牙耳机是一种电子设备,与牙齿和耳朵无直接关联,因此坏了不需要挂牙科或耳科。建议您寻求专业人士的帮助进行维修。”可见其没有像先前测试的其他大模型一样大言不惭地称“挂牙科”,在这一题上没有出现“幻觉”。

▲实测腾讯混元助手回答刁钻问题

然后智东西也尝试了灵感发现中的面试大纲,比如,当对混元说“我要面试云大厂的一名算法工程师”,混元随即给出了包含基本信息、技能与经验、个人品质、其他问题、结束语五个方面18条的面试大纲。

▲实测腾讯混元助手撰写面试大纲

由于篇幅有限,关于混元助手的体验智东西后续再详细呈现。同时,混元大模型结合文档、视频会议产品的体验也将在之后展开。

03.
擅长做产品的腾讯
把务实创新哲学用到了大模型


大模型正在面向全社会开放,今天,腾讯混元大模型也正式通过腾讯云对外开放。
8月15日,网信办发布的《生成式人工智能服务管理暂行办法》正式施行。9月1日,网信办发布第二批深度合成服务算法备案信息,包括腾讯混元大模型在内的多个生成合成类大模型通过备案。

▲腾讯混元大模型等大模型通过备案

正值此节点,汤道生在本次生态大会上宣布,腾讯推出了腾讯云MaaS(模型即服务)。在腾讯云行业大模型的精选商店中,其不仅提供混元大模型,还上架了20多种行业最新最流行的开源通用大模型,以及覆盖金融、文旅、零售、法务、医疗、教育等20多个领域的行业大模型。“我们始终认为,大模型需要基于产业场景与企业数据融合,才能释放出更大的价值。”汤道生说。
用户可以直接调用API接口,或者将混元作为基底模型,在公有云上进行精调应用。在调经应用中心,用户只需根据需要选择合适的模型,然后借助腾讯云智能开平台导入专业专有的数据,做进一步的训练和精调,就能快速生成有针对性的专属大模型,满足个性化的需求。

▲腾讯云MaaS(模型即服务)主要架构

蒋杰告诉智东西,腾讯坚持全链路自研大模型——从第一个Token开始从零训练,算法、框架、平台全链路自研。
比如,腾讯自主研的机器学习的框架AngelPTM,相比主流的开源虚拟框架训练速度提升达一倍,比业界的一些主流框架提升了1.3倍。而支撑这一框架的,是腾讯公司多年以来支持海量高并发的基础设施。
今年4月,腾讯云发布新一代HCC高性能计算集群,采用最新一代星星海自研服务器,搭载超强算力GPU,基于自研网络、存储架构带来3.2T超高互联带宽TB级吞吐能力和千万级IOPS。这一集群可助混元NLP大模型训练在同等数据集下,将训练时间由50天缩短到4天。实测结果显示新一代集群算力性能较前代提升3倍。
6月底,腾讯推出的高性能网络星脉,据称具备业界最高的3.2T通信带宽,为AI大模型带来10倍通信性能提升。大语言模型训练需要大量服务器之间频繁数据通信,通信时间增大往往会造成整体集群的算力损失。通过自研Tita协议和自研TCCL通信库,星脉网络据称可将网络利用率从普通以太网的60%提升到90%以上,从而降低GPU停止计算等待数据的情况,提高整体集群的算力利用率。
7月初,腾讯面向大模型发布腾讯云发布向量数据库。如果大模型是一个智能的处理器,那向量数据库就是配合这台处理器的“外置缓存”。根据腾讯官方数据,将腾讯云向量数据库用于大模型预训练数据的分类、去重和清洗,相比传统方式可以实现10倍效率的提升。如果将向量数据库作为外部知识库用于模型推理,则可以将成本降低2~4个数量级。
全链路自研成果背后是大力的技术研发投入。根据腾讯2023年二季度财报,其二季度研发开支达160亿元,自2018年至今累计投入超过2300亿元。
持续高研发投入促进了成果转化,带动专利曲线持续上扬。截至6月,腾讯在全球主要国家和地区专利申请公开总数超过6.6万件,专利授权数超过3.3万件,主要集中在人工智能、云技术、大出行、即时通讯等前沿领域。

04.
结语:大模型走向全社会
腾讯混元吹响集结号


腾讯董事会主席兼首席执行官马化腾在此前的股东大会上说:“我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇。”而随着大模型加速走向全社会,腾讯混元大模型的一盘棋布局也逐步在公众面前显现。
腾讯正通过切入行业痛点的方式对混元大模型进行技术产品迭代。一方面,其利用腾讯系强大的产品体系训练模型、落地模型、迭代模型。另一方面,其也通过腾讯云在IaaS、PaaS、SaaS多个层面的底座能力,促进混元大模型与产业和行业结合,发挥更大的价值。“百模大战”愈演愈烈,腾讯已经吹响新的集结号。
(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
absolon 2003, kelly brook腾讯推出混元大模型,已接入微信搜一搜、腾讯会议等 50 多个业务及产品京东言犀大模型亮相,应用将分三步走如何打造AR界的“遥遥领先”?对话李宏伟,雷鸟X2实测上手腾讯混元大模型正式亮相,我们抢先试了试它的生产力iPhone 信号太差或将改善 / 腾讯混元大模型正式亮相 / 联发科 3nm 芯片预计 2024 年量产腾讯混元大模型正式亮相;中国移动否认停售iPhone;何小鹏称当下毕业生更要乐观;巴奴确认羊肉卷含鸭肉,赔偿超800万...腾讯混元大模型正式亮相;OpenAI首届开发者大会定档;苹果扩大AI预算|AIGC周观察第十八期你抢到首批 iPhone15 了吗 / 花西子事件后老牌国货销量暴涨 / 腾讯混元大模型将陆续对公众开放 | 未来周报阿里云通义千问开源;腾讯混元大模型开始应用内测;马斯克或从OpenAI买入域名Ai.com丨AIGC大事日报3nm天玑流片成功;比亚迪海豹DM-i发布;微信上线腾讯混元助手一手实测腾讯混元大模型:重逻辑降幻觉,鹅厂自家应用已加持腾讯混元大模型发布;曝小米汽车已试生产近 1 个月;国家网信办对知网罚款5000万元;国际奥委首次会成立电子竞技委员会...腾讯混元大模型亮相:全链路自研,聚焦应用死磕“幻觉”周末随笔小心毒草Helmlock(毒芹)腾讯发布混元大模型!在微信里有个「贾维斯」是什么体验?传OpenAI秘密训练GPT-5;腾讯混元大模型或本周亮相;首个中英语音多模态LLM开源苹果文生图大模型亮相:俄罗斯套娃式扩散,支持1024x1024分辨率腾讯混元大模型落地QQ浏览器;DeepMind去年利润大跌40%;OPPO新小布AI助手公测丨AIGC大事日报工行给力!实测500元大毛混元大模型姗姗来迟,腾讯为什么不着急?|甲子光年腾讯混元大模型开放文生图;微软AI投资重心或转向应用和业务;国产大模型10月榜单公布丨AIGC大事日报苹果 5G 自研基带曝光,iPhone 信号或改善 / 瑞幸将再向茅台采购飞天茅台酒 / 腾讯混元大模型上线珍珠塔的回响知网回应被罚5000万,腾讯混元助手将上线,国际奥委会成立电子竞技委员会,国产二三线SSD厂家或涨价,这就是今天的其他大新闻!首发体验|我抢先在微信里用上「大模型」,腾讯混元正式开放!腾讯混元大模型再进化,文生图能力重磅上线,这里是一手实测腾讯正式发布混元大模型小米正式发布小米澎湃OS;​腾讯混元开放文生图功能,代码能力提升20%;荣耀重返中国第三季度智能手机出货量第一……宝马取消座椅加热订阅服务,腾讯混元大模型上线,银行调整存量首套住房贷款利率,多地试点外卖骑手新型社保,这就是今天的其他大新闻!腾讯AI将至!消息称腾讯9月初发布混元大模型,多款软件已接入测试抖音封禁“快速过款”玩法;交个朋友入淘周年庆单日GMV破2亿;腾讯混元大模型开放“文生图”功能 | 一周简讯周日随笔iPhone 15 系列开启预售 / 华为推出 18K 金智能手表 / 腾讯混元大模型首批通过备案 | 灵感周报
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。