“今天我们非常高兴地告诉大家,腾讯自主研发通用大模型混元正式向产业亮相。”腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生今日宣布。在腾讯一年一度的全球数字生态大会上,腾讯自研大模型的神秘面纱终于揭开。汤道生表示,混元大模型目前已有超千亿的参数规模、超2万亿Tokens的预训练语料,自即日起通过腾讯云对外全面开放。与此同时,腾讯也一并带来了混元大模型“全家桶”的最新消息:腾讯云、腾讯广告、腾讯游戏、腾讯会议、腾讯文档等超过50个腾讯业务和产品,宣布已接入腾讯混元大模型测试,并取得初步效果。随着“百模大战”在我国打响,大模型在场景中的实战检验效果成为产业关注焦点。腾讯本次交出了什么样的“答卷”?作为2018年起就不断传出大模型进展的科技公司,腾讯对大模型有什么样不同理解和布局?智东西记者抵达腾讯全球数字生态大会现场,与腾讯集团副总裁蒋杰进行了深入对话,并上手实测了刚刚亮相的混元大模型,从而对上述问题的答案有了更深入了解。▲腾讯集团副总裁蒋杰
一开场,蒋杰就从这个产业聚焦关注的话题引出话头:“我们希望用大模型提高人们的工作效率,让人们从容享受休闲的时光。然而,大模型在现实世界实际场景中应用非常有限。大模型在容错率高、任务简单的休闲场景已经可用,而在更有价值的严肃场景、工作场景、专业场景,都无法大面积地胜任。为了解锁这样的场景,大模型需要更加可靠,且更加成熟地在复杂场景中胜任更多任务。”针对这一行业普遍难题,腾讯混元大模型从可靠性和成熟性两个维度解题。首先,在可靠性方面,蒋杰称混元大模型有效降低了大语言模型“幻觉”比例,相比主流开源大模型降低30%至50%。所谓“幻觉”,简单说就是大模型“胡言乱语”。为了确保大模型的更加可靠,我们需要减少模型胡言乱语的现象。不同于业界采取加搜索、增强知识图谱等“外挂”做法,蒋杰称,腾讯在预训练阶段采取“探真算法”进行事实修正。比如,让混元写一篇作文,尝试论证关羽和秦琼谁的战斗力更强,它并没有像市面上一些大模型一样将历史事件、人物、时间张冠李戴。
▲混元减少“幻觉”的例子
其次,混元提升了抗诱导能力,面对安全诱导类问题的拒答率提升20%。这也加强了大模型的可靠性。为了提升模型可靠性,腾讯通过深度的优化让模型学会识别陷阱的问题去抵制诱惑。在实际应用中,比如当用户提出一个问题:怎么样超速最安全?不同于其他大模型提出怎样超速的建议,混元则会拒绝回答了这样不安全的问题。这正是因为其在训练中,通过强化学习的方法,让模型对不安全问题说不。▲混元抗诱导能力的例子
与此同时,在成熟性方面,混元大模型覆盖了短文本和千字级别长文本生成能力。当前市面上大模型在超长任务处理上很难实现。腾讯通过位置编码优化,提升长文的处理效果和性能,结合指令跟随优化,让产出内容更符合字数要求,从而提升超长文本的生成和续写能力。▲混元撰写长文的例子
此外,腾讯混元大模型也提升了逻辑思考能力,支持结合实际场景推理决策。在大模型训练中,一些团队会让大模型通过“死记硬背”的方式学会中小学的数学题。但是在现实生活中,“背题”人人都行,还需要让大模型具备理解上下文的能力。腾讯推出思维链新策略,有效强化模型对问题拆解和分步思考的倾向。▲混元逻辑推理能力的例子
可以看到,从行业痛点出发,腾讯正将混元大模型打造成一个具备强大的中文创作能力、复杂语境的逻辑推理能力、可靠的任务执行能力的通用大模型。蒋杰称,混元经过了一系列的严格测评。在中国信通院的测评中,混元大模型在模型开发、模型能力这两项得到了当前的最高分;混元大模型在三大常见的测试集上表现非常强大。▲混元通过多项主流测评
但蒋杰指出,混元的目的不是在评测集上取得高分,而是要将技术运用到实践的场景,助行业去创新提效。
按照腾讯的战略定位,混元大模型是“从实践中来,到实践中去”的实用级大模型。蒋杰透露了混元大模型产品化的最新进展:腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等超过50个腾讯业务和产品,已经接入腾讯混元大模型测试,并取得初步效果。以腾讯会议结合应用为例,基于混元打造的AI小助手能实现会中问答、会议摘要、会议待办项等。比如当用户向AI小助手问道:“会议中黑客马拉松是什么意思?”AI助手便会自动整理相关知识,还包括与会人员关于这个话题的争论讨论。即便没能及时参加会议,用户也能获得关于会议的纪要和待办事项。▲混元与视频会议应用结合
再以腾讯文档场景为例,基于混元大模型的智能助手功能支持数十种文本创作场景,用户可以一键生成标准格式文本,自然语言生成函数,基于表格内容生成图表等,这些功能都已在内测中。▲混元与文档应用结合
在腾讯广告方面,混元大模型支持智能化广告素材创作,满足千人千面,实现文、图、视频自然融合。比如当用户需要生成一个关于踏青路线,且涉及亚洲女性在露营地的海报,当输入提示词后,便能得到AI生成的海报。据称这一应用实际采纳率超42%,远超过业界开源模型。▲混元与腾讯广告应用结合
可以看到,无论是小程序,还是腾讯文档、视频会议等软件,这些都是人们日常手边会用的工具,如果它们全都接入AI大模型,那人们工作效率和社交体验将大大提高。会后,智东西在第一时间亲身体验了小程序版的混元大模型,发现其在一些方面确实有提升。如图所示,混元助手小程序页面风格与微信聊天框类似,设有聊天和灵感发现两框。在聊天栏,用户可以选择点击提示的问题进行提问,也可以自己输入提示词进行提问;在灵感发现栏,页面中有工作邮件、面试大纲、招聘信息、PPT大纲等更多功能化的模块。▲小程序版混元大模型“腾讯混元助手”页面
智东西首先试了下混元的“幻觉”反应。比如,当给AI聊天机器人们挖个小坑问道:“蓝牙耳机坏了挂牙科还是耳科?”混元回答:“蓝牙耳机是一种电子设备,与牙齿和耳朵无直接关联,因此坏了不需要挂牙科或耳科。建议您寻求专业人士的帮助进行维修。”可见其没有像先前测试的其他大模型一样大言不惭地称“挂牙科”,在这一题上没有出现“幻觉”。▲实测腾讯混元助手回答刁钻问题
然后智东西也尝试了灵感发现中的面试大纲,比如,当对混元说“我要面试云大厂的一名算法工程师”,混元随即给出了包含基本信息、技能与经验、个人品质、其他问题、结束语五个方面18条的面试大纲。▲实测腾讯混元助手撰写面试大纲
由于篇幅有限,关于混元助手的体验智东西后续再详细呈现。同时,混元大模型结合文档、视频会议产品的体验也将在之后展开。
大模型正在面向全社会开放,今天,腾讯混元大模型也正式通过腾讯云对外开放。8月15日,网信办发布的《生成式人工智能服务管理暂行办法》正式施行。9月1日,网信办发布第二批深度合成服务算法备案信息,包括腾讯混元大模型在内的多个生成合成类大模型通过备案。▲腾讯混元大模型等大模型通过备案
正值此节点,汤道生在本次生态大会上宣布,腾讯推出了腾讯云MaaS(模型即服务)。在腾讯云行业大模型的精选商店中,其不仅提供混元大模型,还上架了20多种行业最新最流行的开源通用大模型,以及覆盖金融、文旅、零售、法务、医疗、教育等20多个领域的行业大模型。“我们始终认为,大模型需要基于产业场景与企业数据融合,才能释放出更大的价值。”汤道生说。用户可以直接调用API接口,或者将混元作为基底模型,在公有云上进行精调应用。在调经应用中心,用户只需根据需要选择合适的模型,然后借助腾讯云智能开平台导入专业专有的数据,做进一步的训练和精调,就能快速生成有针对性的专属大模型,满足个性化的需求。▲腾讯云MaaS(模型即服务)主要架构
蒋杰告诉智东西,腾讯坚持全链路自研大模型——从第一个Token开始从零训练,算法、框架、平台全链路自研。比如,腾讯自主研的机器学习的框架AngelPTM,相比主流的开源虚拟框架训练速度提升达一倍,比业界的一些主流框架提升了1.3倍。而支撑这一框架的,是腾讯公司多年以来支持海量高并发的基础设施。今年4月,腾讯云发布新一代HCC高性能计算集群,采用最新一代星星海自研服务器,搭载超强算力GPU,基于自研网络、存储架构带来3.2T超高互联带宽TB级吞吐能力和千万级IOPS。这一集群可助混元NLP大模型训练在同等数据集下,将训练时间由50天缩短到4天。实测结果显示新一代集群算力性能较前代提升3倍。6月底,腾讯推出的高性能网络星脉,据称具备业界最高的3.2T通信带宽,为AI大模型带来10倍通信性能提升。大语言模型训练需要大量服务器之间频繁数据通信,通信时间增大往往会造成整体集群的算力损失。通过自研Tita协议和自研TCCL通信库,星脉网络据称可将网络利用率从普通以太网的60%提升到90%以上,从而降低GPU停止计算等待数据的情况,提高整体集群的算力利用率。7月初,腾讯面向大模型发布腾讯云发布向量数据库。如果大模型是一个智能的处理器,那向量数据库就是配合这台处理器的“外置缓存”。根据腾讯官方数据,将腾讯云向量数据库用于大模型预训练数据的分类、去重和清洗,相比传统方式可以实现10倍效率的提升。如果将向量数据库作为外部知识库用于模型推理,则可以将成本降低2~4个数量级。全链路自研成果背后是大力的技术研发投入。根据腾讯2023年二季度财报,其二季度研发开支达160亿元,自2018年至今累计投入超过2300亿元。持续高研发投入促进了成果转化,带动专利曲线持续上扬。截至6月,腾讯在全球主要国家和地区专利申请公开总数超过6.6万件,专利授权数超过3.3万件,主要集中在人工智能、云技术、大出行、即时通讯等前沿领域。
腾讯董事会主席兼首席执行官马化腾在此前的股东大会上说:“我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇。”而随着大模型加速走向全社会,腾讯混元大模型的一盘棋布局也逐步在公众面前显现。腾讯正通过切入行业痛点的方式对混元大模型进行技术产品迭代。一方面,其利用腾讯系强大的产品体系训练模型、落地模型、迭代模型。另一方面,其也通过腾讯云在IaaS、PaaS、SaaS多个层面的底座能力,促进混元大模型与产业和行业结合,发挥更大的价值。“百模大战”愈演愈烈,腾讯已经吹响新的集结号。(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)