Redian新闻
>
华为最新大模型来了!盘古3.0问世,千亿参数规模3万亿tokens,放话「不作诗只做事」

华为最新大模型来了!盘古3.0问世,千亿参数规模3万亿tokens,放话「不作诗只做事」

公众号新闻
明敏 发自 东莞
量子位 | 公众号 QbitAI

终于,华为的大模型动向来了!

盘古大模型3.0,今天正式发布。

最底层的基础大模型包括100亿参数、380亿参数、710亿参数和1000亿参数四个版本,预训练使用了超3万亿tokens。

但和早先的传言不同,盘古大模型3.0并非是盘古版ChatGPT,而是一个面向行业的大模型系列。

用华为自己的话来说就是:

盘古大模型,不作诗。

(而且现场全程没有cue到“生成式”这个关键词)

所以在惯例的现场演示环节,华为也都是派行业大模型出战。

比如让政务大模型判断照片中除了货车外还有哪些车辆违规,可以看到大模型标出了三辆小轿车,而且给出了原因。

与此同时,可提供2000P Flops单集群的昇腾AI云服务在乌兰察布和贵安同时上线。

“千亿规模大模型具备涌现、思维链能力”

不想作诗的盘古大模型3.0,想做的事是面向行业。

这从它的架构上就可以感受到,盘古大模型3.0分为三层:

  • L0:基础大模型,包括自然语言、视觉、多模态、预测、科学计算;

  • L1:N个行业大模型,比如政务、金融、制造、矿山、气象等;

  • L2:更细化场景的模型,提供“开箱即用”的模型服务

其中L0层的基础大模型负责提供通用技能。

模型可分为自然语言大模型和多模态大模型两类。能力覆盖了对话问答、文案生成、图像生成、图像理解等。

预训练数据中包含了超过3万亿tokens,使用了超过1000+TB数据训练,指令微调数据也在千万级

并且盘古基础大模型是一个可伸缩、高可扩展的稀疏-稠密语言大模型。

千亿级别稠密模型已经具备涌现、思维链能力,构成了底座;通过稀疏化使其成为不同“行业专家”,这样可使得推理过程更加高效。

L1层由N个行业大模型构成。

在这方面,华为使用行业公开数据训练了多个行业通用大模型,如政务、金融、制造、矿山、气象等。

比如气象方面,盘古气象大模型的最新成果刚刚登上Nature正刊,只需要1.4秒就能完成24小时全球气象预报。

此外,行业可以换也能基于自有数据在L0、L1基础上,训练自己的专用大模型。

L2层则提供更加细化场景的模型,主打“开箱即用”。可专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景。

据了解,为快速适配、快速满足行业需求,盘古大模型采用完全的分层解耦设计。

在L0和L1大模型的基础上,华为云还提供了大模型行业开发套件,通过对自有数据二次训练,就可以拥有自己的专属行业大模型。

同时,根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。

华为在最底层构建了以鲲鹏和昇腾为基础的AI算力云平台,以及异构计算架构CANN、全场景AI框架昇思MindSpore,AI开发生产线ModelArts等,能为大模型开发和运行提供分布式并行加速,算子和编译优化、集群级通信优化等关键能力。

基于华为的AI根技术,大模型训练效能可以调优到业界主流GPU的1.1倍。

华为云2000P Flops单集群的昇腾AI云服务在乌兰察布和贵安同时上线。

披露数据表明,昇腾云AI服务的千卡训练30天长稳率达到90%,断点恢复时长不超过10分钟。

除了支持华为的AI框架Mindspore外,还支持Pytorch,Tensorflow等主流AI框架,框架中的90%算子,都可以通过华为的迁移工具从GPU平滑迁移到昇腾。

例如,美图仅用30天就将70个模型迁移到了昇腾,同时华为云和美图团队一起进行了30多个算子的优化以及流程的并行加速,AI性能较原有方案提升了30%。

气象大模型登上Nature正刊

在展示盘古大模型3.0的基础能力后,华为也对盘古大模型的一系列行业应用做了数据披露。

最近,盘古气象大模型登上Nature的消息刷屏了。

据悉,盘古气象大模型是首个精度超过传统数值预报方法的AI预测模型,同时预测速度也有大幅提升。

原来预测一个台风未来10天的路径,需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。现在基于预训练的盘古气象大模型,通过AI推理的方式,研究者只需单台服务器上单卡配置,10秒内就可以获得更精确的预测结果。

在药物研发领域,原来一款新药研发平均需要10年时间、花费10亿美金。盘古药物分子大模型助力西安交通大学第一附属医院刘冰教授团队发现全球40年来首个新靶点、新类别的抗生素,并将先导药物研发周期缩短至1个月、研发成本降低70%。

在铁路领域,盘古铁路大模型能精准识别现网运行的67种货车、430多种故障,无故障图片筛除率高达95%,成为货运列检员身边有力的数字助手,将列检员从每日数百万张的“图海”检测中解放出来。

华为常务董事、华为云CEO张平安给最新动向,做了最凝练的总结:

盘古大模型要让每个行业、每个企业、每个人都拥有自己的专家助手,让工作更高效更轻松。

我们始终坚持AI for Industries的战略,在深耕行业的道路上不断前行。我坚信大模型将重塑千行百业,而每一个开发者,都将是改变世界的英雄。

「AIGC+垂直领域社群」

招募中!

欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群,一起学习、探索、创新AIGC!

请备注您想加入的垂直领域「教育」或「电商零售」,加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
国内高校首例!支持千亿参数的大模型训练十亿参数,一键瘦身!「模型减重」神器增强型 SmoothQuant,让大模型狂掉 3/4爱奇艺VR公司业务停滞,员工或被欠薪;阿里云开源通义千问 70 亿参数模型,免费可商用;华为正式发布鸿蒙 4,接入大模型|Q资讯华为将推盘古数字人大模型;搜狗原CMO加盟王小川公司;首个线性注意力Transformer大模型推出丨AIGC大事日报百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报650亿参数,8块GPU就能全参数微调:邱锡鹏团队把大模型门槛打下来了上下文1.6万token的编程大模型来了!与Stable Diffusion出自同门,一次吃5个Python文件不费劲idealism biggest driving forces through challenging times and he传滴滴造车VP创业大模型;澜舟科技推出400亿参数通用大模型;商汤AIGC相关收入增长670.4%Doris Day/Que sera, sera首批AI大模型获批上线,BATH在列;华为Mate 60开售即火,接入盘古大模型;AI操控无人机能力超越人类冠军丨AI周报GPT-4参数最新爆料!1.76万亿参数,8个2200亿MoE模型,PyTorch创始人深信不疑参数是ChaGPT的近6倍!英特尔公布AI大模型Aurora genAI,具备1万亿参数将蛋白质语言模型扩展到千亿参数,深度解读百图生科、清华xTrimoPGLM模型参数是 ChatGPT 的近 6 倍!英特尔公布 AI 大模型 Aurora genAI,具备 1 万亿参数百川开源最强中英文百亿参数模型!超越LLaMA,中国开源大模型开启商用新纪元复旦新作:单机微调650亿参数大模型;蚂蚁、百度参投AI大模型创企;杭州检方对AI换脸案提起公诉丨AIGC大事日报盘古大模型之外,华为首秀大模型时代「硬实力」碾压LLaMA,「猎鹰」彻底开源!400亿参数,万亿token训练,霸榜Hugging Face上海发布大模型政策,打造AI“模”都;罗永浩“曲线上市”成功;华为云正式发布盘古大模型3.0……十亿参数,一键瘦身!「模型减重」神器让大模型狂掉 3/4回家开源大模型新SOTA!支持免费商用,比LLaMA65B小但更强,基于1万亿token不作诗,只做事:华为盘古3.0,给大模型落地定了个调GPT-4内幕大泄露!1.8万亿巨量参数,13万亿token训练,斥资6300万美元直到她去世孩子們才偷看奶奶的日記家庭隱私的邊界/麥迪遜縣的橋樑微软新出热乎论文:Transformer扩展到10亿token十亿参数,一键瘦身!「模型减重」神器让大模型狂掉3/4 | 最“in”大模型“不作诗,只做事”的盘古大模型怎么为文娱行业赋能?650亿参数,8块GPU就能全参数微调!邱锡鹏团队把大模型门槛打下来了!油画 桃林Llama 2高调开源颠覆大模型圈!2万亿token训练,打不过GPT3.5华为盘古大模型将在 7 月重大升级;Keep 通过港交所聆讯;FF 延迟交付,贾跃亭发文致歉 | 极客早知道高达3.6万亿token!PaLM 2训练数据翻5倍,全新Bard对比ChatGPT有8个优势华为云盘古大模型:下矿坑、测台风、进产线,没时间作诗|甲子光年
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。