Redian新闻
>
腾讯混元大模型亮相!实测上手,对话腾讯副总裁蒋杰

腾讯混元大模型亮相!实测上手,对话腾讯副总裁蒋杰

科技

大模型走向全社会,腾讯混元吹响集结号。
作者 |  三北
编辑 |  漠影
“今天我们非常高兴地告诉大家,腾讯自主研发通用大模型混元正式向产业亮相。”腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生今日宣布。在腾讯一年一度的全球数字生态大会上,腾讯自研大模型的神秘面纱终于揭开。
汤道生表示,混元大模型目前已有超千亿的参数规模、超2万亿Tokens的预训练语料,自即日起通过腾讯云对外全面开放。
与此同时,腾讯也一并带来了混元大模型“全家桶”的最新消息:腾讯云、腾讯广告、腾讯游戏、腾讯会议、腾讯文档等超过50个腾讯业务和产品,宣布已接入腾讯混元大模型测试,并取得初步效果。
随着“百模大战”在我国打响,大模型在场景中的实战检验效果成为产业关注焦点。腾讯本次交出了什么样的“答卷”?作为2018年起就不断传出大模型进展的科技公司,腾讯对大模型有什么样不同理解和布局?
智东西记者抵达腾讯全球数字生态大会现场,与腾讯集团副总裁蒋杰进行了深入对话,并上手实测了刚刚亮相的混元大模型,从而对上述问题的答案有了更深入了解。

▲腾讯集团副总裁蒋杰


01.
混元大模型亮相:不止聊天


训练烧钱,百模大战,大家的期待是什么?
一开场,蒋杰就从这个产业聚焦关注的话题引出话头:“我们希望用大模型提高人们的工作效率,让人们从容享受休闲的时光。然而,大模型在现实世界实际场景中应用非常有限。大模型在容错率高、任务简单的休闲场景已经可用,而在更有价值的严肃场景、工作场景、专业场景,都无法大面积地胜任。为了解锁这样的场景,大模型需要更加可靠,且更加成熟地在复杂场景中胜任更多任务。”
针对这一行业普遍难题,腾讯混元大模型从可靠性和成熟性两个维度解题。
首先,在可靠性方面,蒋杰称混元大模型有效降低了大语言模型“幻觉”比例,相比主流开源大模型降低30%至50%。所谓“幻觉”,简单说就是大模型“胡言乱语”。为了确保大模型的更加可靠,我们需要减少模型胡言乱语的现象。

不同于业界采取加搜索、增强知识图谱等“外挂”做法,蒋杰称,腾讯在预训练阶段采取“探真算法”进行事实修正。比如,让混元写一篇作文,尝试论证关羽和秦琼谁的战斗力更强,它并没有像市面上一些大模型一样将历史事件、人物、时间张冠李戴。 


▲混元减少“幻觉”的例子

其次,混元提升了抗诱导能力,面对安全诱导类问题的拒答率提升20%。这也加强了大模型的可靠性。
为了提升模型可靠性,腾讯通过深度的优化让模型学会识别陷阱的问题去抵制诱惑。在实际应用中,比如当用户提出一个问题:怎么样超速最安全?不同于其他大模型提出怎样超速的建议,混元则会拒绝回答了这样不安全的问题。这正是因为其在训练中,通过强化学习的方法,让模型对不安全问题说不。

▲混元抗诱导能力的例子

与此同时,在成熟性方面,混元大模型覆盖了短文本和千字级别长文本生成能力。当前市面上大模型在超长任务处理上很难实现。腾讯通过位置编码优化,提升长文的处理效果和性能,结合指令跟随优化,让产出内容更符合字数要求,从而提升超长文本的生成和续写能力。

▲混元撰写长文的例子

此外,腾讯混元大模型也提升了逻辑思考能力,支持结合实际场景推理决策。在大模型训练中,一些团队会让大模型通过“死记硬背”的方式学会中小学的数学题。但是在现实生活中,“背题”人人都行,还需要让大模型具备理解上下文的能力。腾讯推出思维链新策略,有效强化模型对问题拆解和分步思考的倾向。

▲混元逻辑推理能力的例子

可以看到,从行业痛点出发,腾讯正将混元大模型打造成一个具备强大的中文创作能力、复杂语境的逻辑推理能力、可靠的任务执行能力的通用大模型。
蒋杰称,混元经过了一系列的严格测评。在中国信通院的测评中,混元大模型在模型开发、模型能力这两项得到了当前的最高分;混元大模型在三大常见的测试集上表现非常强大。

▲混元通过多项主流测评

蒋杰指出,混元的目的不是在评测集上取得高分,而是要将技术运用到实践的场景,助行业去创新提效。

02.
实测混元:实用级大模型在手边
视频、文档都已接入


按照腾讯的战略定位,混元大模型是“从实践中来,到实践中去”的实用级大模型。
蒋杰透露了混元大模型产品化的最新进展:腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等超过50个腾讯业务和产品,已经接入腾讯混元大模型测试,并取得初步效果。
以腾讯会议结合应用为例,基于混元打造的AI小助手能实现会中问答、会议摘要、会议待办项等。比如当用户向AI小助手问道:“会议中黑客马拉松是什么意思?”AI助手便会自动整理相关知识,还包括与会人员关于这个话题的争论讨论。即便没能及时参加会议,用户也能获得关于会议的纪要和待办事项。

▲混元与视频会议应用结合

再以腾讯文档场景为例,基于混元大模型的智能助手功能支持数十种文本创作场景,用户可以一键生成标准格式文本,自然语言生成函数,基于表格内容生成图表等,这些功能都已在内测中。

▲混元与文档应用结合

在腾讯广告方面,混元大模型支持智能化广告素材创作,满足千人千面,实现文、图、视频自然融合。比如当用户需要生成一个关于踏青路线,且涉及亚洲女性在露营地的海报,当输入提示词后,便能得到AI生成的海报。据称这一应用实际采纳率超42%,远超过业界开源模型。

▲混元与腾讯广告应用结合

可以看到,无论是小程序,还是腾讯文档、视频会议等软件,这些都是人们日常手边会用的工具,如果它们全都接入AI大模型,那人们工作效率和社交体验将大大提高。
会后,智东西在第一时间亲身体验了小程序版的混元大模型,发现其在一些方面确实有提升。
如图所示,混元助手小程序页面风格与微信聊天框类似,设有聊天和灵感发现两框。在聊天栏,用户可以选择点击提示的问题进行提问,也可以自己输入提示词进行提问;在灵感发现栏,页面中有工作邮件、面试大纲、招聘信息、PPT大纲等更多功能化的模块。

▲小程序版混元大模型“腾讯混元助手”页面

智东西首先试了下混元的“幻觉”反应。比如,当给AI聊天机器人们挖个小坑问道:“蓝牙耳机坏了挂牙科还是耳科?”混元回答:“蓝牙耳机是一种电子设备,与牙齿和耳朵无直接关联,因此坏了不需要挂牙科或耳科。建议您寻求专业人士的帮助进行维修。”可见其没有像先前测试的其他大模型一样大言不惭地称“挂牙科”,在这一题上没有出现“幻觉”。

▲实测腾讯混元助手回答刁钻问题

然后智东西也尝试了灵感发现中的面试大纲,比如,当对混元说“我要面试云大厂的一名算法工程师”,混元随即给出了包含基本信息、技能与经验、个人品质、其他问题、结束语五个方面18条的面试大纲。

▲实测腾讯混元助手撰写面试大纲

由于篇幅有限,关于混元助手的体验智东西后续再详细呈现。同时,混元大模型结合文档、视频会议产品的体验也将在之后展开。

03.
擅长做产品的腾讯
把务实创新哲学用到了大模型


大模型正在面向全社会开放,今天,腾讯混元大模型也正式通过腾讯云对外开放。
8月15日,网信办发布的《生成式人工智能服务管理暂行办法》正式施行。9月1日,网信办发布第二批深度合成服务算法备案信息,包括腾讯混元大模型在内的多个生成合成类大模型通过备案。

▲腾讯混元大模型等大模型通过备案

正值此节点,汤道生在本次生态大会上宣布,腾讯推出了腾讯云MaaS(模型即服务)。在腾讯云行业大模型的精选商店中,其不仅提供混元大模型,还上架了20多种行业最新最流行的开源通用大模型,以及覆盖金融、文旅、零售、法务、医疗、教育等20多个领域的行业大模型。“我们始终认为,大模型需要基于产业场景与企业数据融合,才能释放出更大的价值。”汤道生说。
用户可以直接调用API接口,或者将混元作为基底模型,在公有云上进行精调应用。在调经应用中心,用户只需根据需要选择合适的模型,然后借助腾讯云智能开平台导入专业专有的数据,做进一步的训练和精调,就能快速生成有针对性的专属大模型,满足个性化的需求。

▲腾讯云MaaS(模型即服务)主要架构

蒋杰告诉智东西,腾讯坚持全链路自研大模型——从第一个Token开始从零训练,算法、框架、平台全链路自研。
比如,腾讯自主研的机器学习的框架AngelPTM,相比主流的开源虚拟框架训练速度提升达一倍,比业界的一些主流框架提升了1.3倍。而支撑这一框架的,是腾讯公司多年以来支持海量高并发的基础设施。
今年4月,腾讯云发布新一代HCC高性能计算集群,采用最新一代星星海自研服务器,搭载超强算力GPU,基于自研网络、存储架构带来3.2T超高互联带宽TB级吞吐能力和千万级IOPS。这一集群可助混元NLP大模型训练在同等数据集下,将训练时间由50天缩短到4天。实测结果显示新一代集群算力性能较前代提升3倍。
6月底,腾讯推出的高性能网络星脉,据称具备业界最高的3.2T通信带宽,为AI大模型带来10倍通信性能提升。大语言模型训练需要大量服务器之间频繁数据通信,通信时间增大往往会造成整体集群的算力损失。通过自研Tita协议和自研TCCL通信库,星脉网络据称可将网络利用率从普通以太网的60%提升到90%以上,从而降低GPU停止计算等待数据的情况,提高整体集群的算力利用率。
7月初,腾讯面向大模型发布腾讯云发布向量数据库。如果大模型是一个智能的处理器,那向量数据库就是配合这台处理器的“外置缓存”。根据腾讯官方数据,将腾讯云向量数据库用于大模型预训练数据的分类、去重和清洗,相比传统方式可以实现10倍效率的提升。如果将向量数据库作为外部知识库用于模型推理,则可以将成本降低2~4个数量级。
全链路自研成果背后是大力的技术研发投入。根据腾讯2023年二季度财报,其二季度研发开支达160亿元,自2018年至今累计投入超过2300亿元。
持续高研发投入促进了成果转化,带动专利曲线持续上扬。截至6月,腾讯在全球主要国家和地区专利申请公开总数超过6.6万件,专利授权数超过3.3万件,主要集中在人工智能、云技术、大出行、即时通讯等前沿领域。

04.
结语:大模型走向全社会
腾讯混元吹响集结号


腾讯董事会主席兼首席执行官马化腾在此前的股东大会上说:“我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇。”而随着大模型加速走向全社会,腾讯混元大模型的一盘棋布局也逐步在公众面前显现。
腾讯正通过切入行业痛点的方式对混元大模型进行技术产品迭代。一方面,其利用腾讯系强大的产品体系训练模型、落地模型、迭代模型。另一方面,其也通过腾讯云在IaaS、PaaS、SaaS多个层面的底座能力,促进混元大模型与产业和行业结合,发挥更大的价值。“百模大战”愈演愈烈,腾讯已经吹响新的集结号。
(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
腾讯混元大模型正式亮相;中国移动否认停售iPhone;何小鹏称当下毕业生更要乐观;巴奴确认羊肉卷含鸭肉,赔偿超800万...抖音封禁“快速过款”玩法;交个朋友入淘周年庆单日GMV破2亿;腾讯混元大模型开放“文生图”功能 | 一周简讯腾讯推出混元大模型,已接入微信搜一搜、腾讯会议等 50 多个业务及产品一手实测腾讯混元大模型:重逻辑降幻觉,鹅厂自家应用已加持腾讯AI将至!消息称腾讯9月初发布混元大模型,多款软件已接入测试苹果文生图大模型亮相:俄罗斯套娃式扩散,支持1024x1024分辨率你抢到首批 iPhone15 了吗 / 花西子事件后老牌国货销量暴涨 / 腾讯混元大模型将陆续对公众开放 | 未来周报混元大模型姗姗来迟,腾讯为什么不着急?|甲子光年周末随笔腾讯混元大模型落地QQ浏览器;DeepMind去年利润大跌40%;OPPO新小布AI助手公测丨AIGC大事日报苹果 5G 自研基带曝光,iPhone 信号或改善 / 瑞幸将再向茅台采购飞天茅台酒 / 腾讯混元大模型上线腾讯混元大模型亮相:全链路自研,聚焦应用死磕“幻觉”腾讯混元大模型正式亮相,我们抢先试了试它的生产力周日随笔腾讯混元大模型发布;曝小米汽车已试生产近 1 个月;国家网信办对知网罚款5000万元;国际奥委首次会成立电子竞技委员会...知网回应被罚5000万,腾讯混元助手将上线,国际奥委会成立电子竞技委员会,国产二三线SSD厂家或涨价,这就是今天的其他大新闻!如何打造AR界的“遥遥领先”?对话李宏伟,雷鸟X2实测上手腾讯混元大模型开放文生图;微软AI投资重心或转向应用和业务;国产大模型10月榜单公布丨AIGC大事日报阿里云通义千问开源;腾讯混元大模型开始应用内测;马斯克或从OpenAI买入域名Ai.com丨AIGC大事日报首发体验|我抢先在微信里用上「大模型」,腾讯混元正式开放!腾讯发布混元大模型!在微信里有个「贾维斯」是什么体验?京东言犀大模型亮相,应用将分三步走宝马取消座椅加热订阅服务,腾讯混元大模型上线,银行调整存量首套住房贷款利率,多地试点外卖骑手新型社保,这就是今天的其他大新闻!传OpenAI秘密训练GPT-5;腾讯混元大模型或本周亮相;首个中英语音多模态LLM开源absolon 2003, kelly brook小心毒草Helmlock(毒芹)iPhone 信号太差或将改善 / 腾讯混元大模型正式亮相 / 联发科 3nm 芯片预计 2024 年量产3nm天玑流片成功;比亚迪海豹DM-i发布;微信上线腾讯混元助手腾讯正式发布混元大模型珍珠塔的回响腾讯混元大模型正式亮相;OpenAI首届开发者大会定档;苹果扩大AI预算|AIGC周观察第十八期iPhone 15 系列开启预售 / 华为推出 18K 金智能手表 / 腾讯混元大模型首批通过备案 | 灵感周报工行给力!实测500元大毛腾讯混元大模型再进化,文生图能力重磅上线,这里是一手实测小米正式发布小米澎湃OS;​腾讯混元开放文生图功能,代码能力提升20%;荣耀重返中国第三季度智能手机出货量第一……
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。