Redian新闻
>
腾讯混元大模型正式亮相,我们抢先试了试它的生产力

腾讯混元大模型正式亮相,我们抢先试了试它的生产力

科技

机器之心报道

作者:泽南

腾讯这个重量级玩家终于出手了。

上个星期,国内首批大模型备案获批,开始面向全社会开放服务,大模型正式进入了规模应用的新阶段。在前期发布应用的行列中,有些科技巨头似乎还没有出手。


很快到了 9 月 7 日,在 2023 腾讯全球数字生态大会上,腾讯正式揭开了混元大模型的面纱,并通过腾讯云对外开放。


作为一个超千亿参数的大模型,混元使用的预训练语料超过两万亿 token,凭借多项独有的技术能力获得了强大的中文创作能力、复杂语境下的逻辑推理能力,以及可靠的任务执行能力。


腾讯集团副总裁蒋杰表示:「腾讯混元大模型是从第一个 token 开始从零训练的,我们掌握了从模型算法到机器学习框架,再到 AI 基础设施的全链路自研技术。」


打开大模型,全部都是生产力


腾讯一直表示在大模型的相关方向上早已有所布局,专项研究一直有序推进。


这个不是「新技术」的大模型是什么级别?在大会上蒋杰通过直接询问混元大模型的方式透露了一些基本信息,它的参数量是千亿级,训练用的数据截止到今年 7 月份,此外腾讯也表示大模型的知识将会每月更新。


腾讯在现场展示了「腾讯混元大模型小程序」、腾讯文档中的 AI 助手以及腾讯会议 AI 助手的能力。


机器之心第一时间获得测试资格尝试了一番,首先是微信小程序。



一进小程序,我们发现其中的内容不亚于其他家大模型产品的独立 APP。这里有一个「灵感发现」,看看混元都能做些什么:



从生产力、生活、娱乐到编程开发,它开放的能力可谓非常全面了,符合一个千亿级大模型的身份。那么混元真的能有效地完成这些任务吗?


我要写一份 PPT,只想好了主题却不知从何写起,问一下混元大模型。只需几秒,AI 就给了一份分出七个部分的大纲,每一部分里也包含细分的点:



输入一篇 arXiv 上 9 月份谷歌提交的论文《RLAIF: Scaling Reinforcement Learning from Human Feedback with AI Feedback》摘要和介绍部分,长长的好几段,很多大模型根本不支持这么多输入内容,混元大模型直接进行了总结顺便翻译成中文。



大概意思是在说,大模型训练中人类反馈的强化学习(RLHF)也是可以被 AI 替代的?


一个到了实用阶段的大模型,是可以帮我们写代码的。现在我们给 AI 一段代码,让它解释一下其中看不懂也没有注释清楚的内容:



它详细解释了平方根倒数算法里面数字的意义(不过对注释理解得不太透彻)。或许过不了多久,我们做开发的时候就离不开大模型了。


然后是腾讯文档。很多人已经把 GPT-4 等大模型工具用在了自己的工作流程中,混元大模型在腾讯文档推出的智能助手功能中已有应用。在 PC 端新建智能文档,输入 “/”,就能根据需求实现内容生成、翻译、润色等操作。



随后输入自然语言指令,大模型的生成能力就可以帮你在腾讯文档中进行长文本总结归纳:



看起来会对写论文很有用。


当然,如果你给出了一个主题,它能进行文本创作,你再选定生成内容的一部分,AI 也可以多次细化编辑。写完了还能一键翻译:



此外,表格的数据计算和图表生成也都是一句话的事。

 


目前这些功能正在内测阶段,将在成熟后面向用户开放。


混元大模型在腾讯会议中的应用可以帮助一时走神的你。比如在会议进行当中,你可以随时问 AI 助手刚才发言的人说了些什么,或是刚才那两个人到底在争论些什么,AI 可以悄悄把内容帮你总结成一小段话,列出清楚的一二三条来。


 

当然,会开完以后混元大模型也可以更快更全面地总结会议内容,标注好待办事项。


已覆盖腾讯超过 50 个业务


蒋杰总结了混元大模型的三大特点:具备强大的中文创作能力、复杂语境下的逻辑推理能力以及可靠的任务执行能力。


目前不少业内大模型在场景中的应用依然有限,主要问题集中在容错率高,只适用于任务简单的休闲场景。腾讯在算法层面进行了一系列自研创新,提高了模型可靠性和成熟度。


腾讯集团副总裁蒋杰在活动中。


针对大模型容易「胡言乱语」的问题,腾讯优化了预训练算法及策略,通过自研的「探真」技术,让混元大模型的「幻觉」相比主流开源大模型降低了 30-50%。


「业界的做法是提供搜索增强,知识图谱等『外挂』来提升大模型开卷考试的能力。这种方式增加了模型的知识,但在实际应用中存在很多局限性,」蒋杰表示。「混元大模型在开发初期就考虑完全不依赖外界数据的方式,进行了大量研究尝试,我们找到的预训练方法,很大程度上解决了幻觉的问题。」


腾讯还通过强化学习的方法,让模型学会识别陷阱问题,通过位置编码的优化,提高了模型处理超长文的效果和性能。在逻辑方面,腾讯提出了思维链的新策略,让大模型能够像人一样结合实际的应用场景进行推理和决策。


腾讯混元大模型能够理解上下文的含义,具有长文记忆能力,可以流畅地进行专业领域的多轮对话。除此之外,它还能进行文学创作、文本摘要、角色扮演等内容创作,做到充分理解用户意图,并高效、准确的给出有时效性的答复。这样的技术落地之后,才能真正提升生产力。


写一篇 4000 字的内容,GPT-4 也达不到要求,混元大模型可以做到。


在中国信通院《大规模预训练模型技术和应用的评估方法》的标准符合性测试中,混元大模型共测评 66 个能力项,在「模型开发」和「模型能力」两个领域的综合评价获得了当前最高分。在主流的评测集 MMLU、CEval 和 AGI-eval 上,混元大模型均有优异的表现,特别是在中文的理科、高考题和数学等子项上表现突出。 


构建大模型的意义在于行业应用。据了解,腾讯内部已有超过 50 个业务和产品接入并测试了腾讯混元大模型,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ 浏览器等,并取得了初步效果。腾讯的程序员们,已经在用大模型工具提高开发效率了。


此外,腾讯还通过自研机器学习框架 Angel,使模型的训练速度相比业界主流框架提升 1 倍,推理速度比业界主流框架提升 1.3 倍。 


用于构建大模型的基础设施也没有拉下。此前腾讯曾表示已于今年年初构建了大规模算力中心,近期 MiniMax 和百川智能旗下的大模型都使用了腾讯的算力。


腾讯也在致力于把行业数据与自身能力相结合,基于外部客户的行业化数据来解决行业特定问题,与实体行业结合,不断推动大模型的社会、经济利益和商业价值。


「根据公开数据显示,国内已有 130 个大模型发布。其中既有通用模型也有专业领域模型。混元作为通用模型能够支持腾讯内部的大部分业务,今天我展示的几个深度接入的业务都有很大的用户量。大模型已在我们的核心领域获得了深度应用,」蒋杰说道。「我大模型首先是服务企业本身,其次是通过腾讯云对外开放。」


在开放给客户使用时,混元大模型将作为腾讯云模型即服务 MaaS 的底座。客户既可以直接调用混元 API,也能将混元作为基座模型,为不同的产业场景构建专属应用。


可见,腾讯在大模型领域的策略讲究的是一个稳字:专注打好基础,不急于拿出半成品展示。而这一出手,就展现出了过硬的实力。



不过大模型的发展还在继续,正如蒋杰所言:「毫不夸张地说,腾讯已经全面拥抱大模型。我们的能力一直在演进,相信 AIGC 的潜力是无限的,我们已在路上。」


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
腾讯混元大模型落地QQ浏览器;DeepMind去年利润大跌40%;OPPO新小布AI助手公测丨AIGC大事日报腾讯混元大模型亮相:全链路自研,聚焦应用死磕“幻觉”混元大模型姗姗来迟,腾讯为什么不着急?|甲子光年iPhone 15 系列开启预售 / 华为推出 18K 金智能手表 / 腾讯混元大模型首批通过备案 | 灵感周报《竹枝词》&《界》3nm天玑流片成功;比亚迪海豹DM-i发布;微信上线腾讯混元助手宝马取消座椅加热订阅服务,腾讯混元大模型上线,银行调整存量首套住房贷款利率,多地试点外卖骑手新型社保,这就是今天的其他大新闻!纽约纽约:河边小景,江南“浙里”重读'习近平此次访俄,中俄关系由盛转衰的开始'腾讯推出混元大模型,已接入微信搜一搜、腾讯会议等 50 多个业务及产品知网回应被罚5000万,腾讯混元助手将上线,国际奥委会成立电子竞技委员会,国产二三线SSD厂家或涨价,这就是今天的其他大新闻!吹尽黄沙不见金(五十): 少年心事传OpenAI秘密训练GPT-5;腾讯混元大模型或本周亮相;首个中英语音多模态LLM开源腾讯混元大模型正式亮相;OpenAI首届开发者大会定档;苹果扩大AI预算|AIGC周观察第十八期又一家巨头企业的大模型正式亮相腾讯正式发布混元大模型苹果 5G 自研基带曝光,iPhone 信号或改善 / 瑞幸将再向茅台采购飞天茅台酒 / 腾讯混元大模型上线腾讯混元大模型正式亮相;中国移动否认停售iPhone;何小鹏称当下毕业生更要乐观;巴奴确认羊肉卷含鸭肉,赔偿超800万...腾讯混元大模型再进化,文生图能力重磅上线,这里是一手实测iPhone 信号太差或将改善 / 腾讯混元大模型正式亮相 / 联发科 3nm 芯片预计 2024 年量产腾讯混元大模型开放文生图;微软AI投资重心或转向应用和业务;国产大模型10月榜单公布丨AIGC大事日报九款新品齐发,新品牌正式亮相,瑞孚迪Revvity携手本土伙伴共同探索转化医学前沿首发体验|我抢先在微信里用上「大模型」,腾讯混元正式开放!腾讯混元大模型发布;曝小米汽车已试生产近 1 个月;国家网信办对知网罚款5000万元;国际奥委首次会成立电子竞技委员会...你抢到首批 iPhone15 了吗 / 花西子事件后老牌国货销量暴涨 / 腾讯混元大模型将陆续对公众开放 | 未来周报抖音封禁“快速过款”玩法;交个朋友入淘周年庆单日GMV破2亿;腾讯混元大模型开放“文生图”功能 | 一周简讯浪潮信息:发布大模型智算软件栈OGAI,为大模型创新打造高效生产力腾讯发布混元大模型!在微信里有个「贾维斯」是什么体验?腾讯混元大模型亮相!实测上手,对话腾讯副总裁蒋杰腾讯AI将至!消息称腾讯9月初发布混元大模型,多款软件已接入测试字节跳动类ChatGPT产品「豆包」邀测,我们先试了一下小米正式发布小米澎湃OS;​腾讯混元开放文生图功能,代码能力提升20%;荣耀重返中国第三季度智能手机出货量第一……阿里云通义千问开源;腾讯混元大模型开始应用内测;马斯克或从OpenAI买入域名Ai.com丨AIGC大事日报李承鹏的漱洗一手实测腾讯混元大模型:重逻辑降幻觉,鹅厂自家应用已加持
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。