Redian新闻
>
稀疏化80%!Graphcore携手Aleph Alpha解锁人工智能计算效率新突破

稀疏化80%!Graphcore携手Aleph Alpha解锁人工智能计算效率新突破

公众号新闻

近日,Graphcore拟未携手合作伙伴Aleph Alpha[1]公布了双方在人工智能计算效率方面的重大进展——将一个130亿个参数的模型稀疏化至仅26亿个参数。


这项先进的技术利用了IPU对点稀疏矩阵乘法的支持(这是IPU专为人工智能设计架构的特点),在保留模型大部分功能的同时,删除了约80%的模型权重。


这两家公司在得克萨斯州的SC22上,展示了Aleph Alpha的商用Luminous对话机器人(Luminous Chatbot)的稀疏化变体。


和其密集型相比,Luminous Base Sparse使用的处理FLOPs仅为20%,使用的存储仅为44%。重要的是,它的26亿个参数可以完整储存在IPU-POD16 Classic的超高速片上存储中,使其性能最大化。



参数剪枝

目前,大多数人工智能应用都使用密集型模型,对所有的参数进行相同形式的表示和计算,无论这些参数它们是否对模型行为产生了影响。因此,宝贵的处理时间和存储被用于储存和执行没有影响的参数的计算。


Aleph Alpha和拟未能够“修剪”80%的不相关权重,并重新训练只使用重要权重的Luminous模型。这些权重用压缩稀疏行(CSR)格式表示。



推理所需的计算FLOPS下降至密集型模型的20%,而存储使用减少至44%,这是由于需要一些额外的容量来储存其余非零参数的位置和值的信息。


该稀疏化模型的能耗也比密集型模型低38%。




关键效率

人们认为,在应对人工智能模型规模的指数级增长和对计算需求的相应增加方面,稀疏化非常重要。


语言、视觉和多模态模型能力的很多进步都是由规模驱动的。然而,训练计算量随参数数量的平方增加,这带来了成本的上升,运营和扩展越来越大的人工智能解决方案的可持续性也因此受到质疑。


对于能力甚至远在分布尾部的下一代模型,稀疏化将变得非常重要,使高度专业化的子模型能够有效地掌握相对应的专业部分的知识。


使用诸如粗粒度稀疏性或选择性等技术提供了实现持续快速进步的潜力,并实现了计算量的可持续线性增长。


人工智能计算需求面临的巨大下行压力,扩大了Aleph Alpha等人工智能初创公司的商业潜力,这些公司能够以尽可能小的计算需求为客户部署高能力模型。



Aleph Alpha

拟未和Aleph Alpha在2022年早些时候首次宣布了在研究和模型部署方面进行合作的意向。


Aleph Alpha正在开发欧洲制造的原创多模态模型,其中包括广受赞誉的Luminous。Luminous能够处理多语种的语言任务,以及理解和回答任何语言和视觉信息组合的相关背景问题。


原始的Luminous模型可通过API向希望建立人工智能驱动的产品和服务的公司及组织提供商业服务。


拟未和Aleph Alpha提供基于其稀疏的Luminous Base和300亿个参数的Luminous Extended模型的商业应用,其中包括面向(基于企业知识的)应用的对话式用户体验。


Aleph Alpha的alphaONE数据中心里的拟未IPU



[1]https://www.aleph-alpha.com





获取更多Graphcore资讯,阅读深度技术文章,并与其他创新者们一起交流,请至中国官网graphcore.cn,以及关注Graphcore微信、微博和知乎创新社区。

Graphcore中国官网

Graphcore官方微信

Graphcore微博创新社区

Graphcore知乎创新社区


点击阅读原文,查看英文blog。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
hǎo xiǎng “rua” 🤩说三道四(120)漫谈人生的“轨迹”也是运动冠军是巴西!人工智能精准预测世界杯!人工智能就业趋势大公开!麻了!GRE太低,被港中文要求再考!这些专业没考GRE可能直接拒!?数据如何助力企业发展?从高性能计算、商业智能、数据库三个领域分享伴君如伴睡 他以为自己全宇宙最清醒EMNLP 2022 | 稠密检索新突破:华为提出掩码自编码预训练模型【最新】发展壮大未来产业集群!这个方案聚焦智能计算、通用AI、量子科技、6G技术等未来产业Npj Comput. Mater.: 高温合金—反向晶界能计算助力科研!阿贡国家实验室新引入Graphcore Bow IPU人工智能系统Deep Longevity:人工智能衰老时钟,会是长寿科技启动的第一批风口吗?|科技前哨中山大学HCP Lab团队:AI解题新突破,神经网络推开数学推理大门「中科时代」获数千万元Pre-A轮融资,以国产工业智能计算机加速工业自动化发展|早起看早期‘Sleeping Assistants’ Are Talking Chinese Insomniacs to Sleep「百炼智能」完成超亿元人民币Pre-B轮融资,人工智能加速B2B业务增长|36氪首发引导基金首次参股市场化GP,政策型LP迎来新突破【胡思乱讲】巴塔哥尼亚:一次改变人生的传奇旅行,etc.英伟达将与微软联手开发人工智能超级计算机AlphaTensor横空出世!打破矩阵乘法计算速度50年纪录,DeepMind新研究再刷Nature封面,详细算法已开源9位院士12位专家联合撰文:智能计算的新进展、挑战与未来 | Science合作期刊上海人工智能实验室招收人工智能加速计算全息实习生带你深入了解红帽RHCSA/RHCE/RHCA认证相关信息Science与之江实验室联合发布:智能计算领域10个重大科学问题BioBit Program启动!之江实验室携手全球顶级研究团队开展生物计算国际科学合作2022百度智算峰会邀请函:带你解锁智能计算与产业共生的最短路径 | Q推荐土法炼钢和绿色未来北京内推 | 北京智源人工智能研究院招聘NLP/多模态算法研究员平价买到高级感!IKEA全新 OBEGRÄNSAD系列,全系列都好看!For Gen-Z, Entrepreneurship Represents a Ticket to FreedomJoule专访山大高珂教授:小分子太阳电池新突破 | Cell Press对话科学家IKEA x OBEGRÄNSAD联名!宜家22年最受瞩目系列开售!科研实习 | 清华大学深圳国际研究生院智能计算实验室招收科研实习生IDC&浪潮:2022-2023中国人工智能计算力发展评估报告「稀疏编码」从理论走向实用!马毅教授NeurIPS 2022新作:稀疏卷积性能和稳健性超越ResNet
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。