Redian新闻
>
新的AI模型,将GPU用量降低100倍

新的AI模型,将GPU用量降低100倍

公众号新闻

👆如果您希望可以时常见面,欢迎标星🌟收藏哦~


来源:内容由半导体行业观察(ID:icbank)编译自hpcwire,谢谢。


在市场将索伦之眼转向 GenAI(例如 ChatGPT)之前,传统神经网络受到了大部分关注。这些类型的神经网络的特点是具有一些“短期”记忆,称为循环神经网络或 RNN。它们在 Apple Siri 或 Google Translate 等许多“智能”技术中继续使用,并且绝不过时。


最近,一篇新发表的,题为《RWKV: Reinventing RNNs for the Transformer Era》的论文描述了一种具有 GPT 级别 LLM 性能的 RNN,它也可以像 GPT Transformer(可并行化)一样直接训练,计算要求降低 10 到 100 倍。(即更少的 GPU)。


该论文描述了像 ChatGPT 这样的转换器如何彻底改变了几乎所有自然语言处理 (NLP) 任务,但却受到内存和计算复杂性的影响,这些复杂性与序列长度呈二次方关系(即,向模型添加更多内容,将需要更多内容平方更多的计算资源)计算)。


相比之下,循环神经网络 (RNN) 在内存和计算要求方面表现出线性扩展(即,向模型添加更多内容,将占用成比例/线性数量的计算资源)。然而,由于并行化和可扩展性的限制,RNN 很难达到与 Transformer 相同的性能。


本文提出了一种新颖的模型架构——接收加权键值(RWKV:Receptance Weighted Key Value),它将 Transformer 的高效并行训练与 RNN 的高效推理相结合。


初步结果相当惊人。从积极的一面来看,RWKV 方法提供了:


  • 运行和训练时降低资源使用率(VRAM、CPU、GPU 等);

  • 与具有大上下文大小的转换器相比,计算要求降低了 10 倍到 100 倍;

  • 线性缩放到任何上下文长度(Transformer 以二次方缩放);

  • 在回答质量和能力方面表现同样出色;

  • 与大多数现有模型相比,模型通常可以更好地用其他语言(例如中文、日语等)进行训练;


RWKV 模型当前面临的一些挑战是:


  • 对提示格式敏感;您可能需要更改提示模型的方式;

  • 它在需要回顾的任务上较弱,因此相应地重新排列提示(例如,不要说“对于上面的文档,执行 X”,这将需要回顾。而是说“对于下面的文档执行 X”) );

  • RWKV ( wiki ) 也是 Linux 基金会下一项开源、赞助商支持的非营利项目。他们的目标是结合最好的 RNN 和 Transformer 技术,包括出色的性能、快速推理、训练、VRAM、“无限”上下文长度和自由句子嵌入;


此外,与 LLM 不同,RWKV 100% attention-free。


RWKV 等项目的影响是巨大的。RWKV 模型不需要购买(租用)100 个 GPU 来训练 LLM 模型,而是可以以不到 10 个 GPU 的成本提供类似的结果。


HuggingFace 上提供了预训练、微调的 7B 世界模型(在更大、更多样化的数据组合上训练的基本模型,其中包括来自 100 多种语言的样本,并且经过部分指令训练。)



原文链接

https://www.hpcwire.com/2024/01/29/new-alternative-ai-model-10-100x-less-gpus-but-same-results/


点这里👆加关注,锁定更多原创内容

END


*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第3661期内容,欢迎关注。


推荐阅读


EUV光刻机重磅报告,美国发布

碳化硅“狂飙”:追赶、内卷、替代

芯片巨头,都想“干掉”工程师!

苹果,玩转先进封装

GPU的历史性时刻!

大陆集团,开发7nm芯片

张忠谋最新采访:中国会找到反击方法

EUV光刻的新“救星”

『半导体第一垂直媒体』

实时 专业 原创 深度

公众号ID:icbank


喜欢我们的内容就点“在看”分享给小伙伴哦

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
2024春节档票房超80亿元,《热辣滚烫》成票房冠军;美国专利局拒绝OpenAI将GPT注册商标丨邦早报【降价啦最低1.82%手续费!】完成开卡消费之用信用卡提前交税(1040-ES Estimated Tax 预估税等)热搜,低调,游艇System76 升级 Serval WS Linux 移动工作站,最高 i9-14900HX CPU+RTX 4070 GPU今晚开始迎大量降雪,整个巴黎大区橙色警报!法国房市50年来最严重滑坡,今年房价或跌5%至7%!超市价格暴涨终于要结束了?首个国产开源MoE大模型来了!性能媲美Llama 2-7B,计算量降低60%胖子先刷脂、再虐腹!刷低10%体脂率就靠这招!英伟达吞噬世界!新架构超级GPU问世,AI算力一步提升30倍深入了解浮点运算——CPU和GPU算力是如何计算的黄仁勋甩出最强AI核弹!GPU新架构性能暴涨30倍,首发人形机器人大模型,联手苹果闯MRH100/H200、B100、X100 GPU架构演进总结AI早知道|OpenAI将推出基于GPTs使用量的分成机制;X AI 发布Grok-1.5国产「GPTs」上线!全面对标 OpenAI 的智谱发布大模型,性能逼近 GPT-4微软教小模型推理进阶版:Orca 2性能媲美10倍参数模型,已开源《跌宕起伏心灵煎熬的14天》(2) 【警署事故中心】天气“非常恶劣”!热带气旋登陆澳洲,或将带来大量降雨,再度引发山洪危机无注意力大模型Eagle7B:基于RWKV,推理成本降低10-100 倍谁是朱万利System76 升级 Serval WS Linux 移动工作站:最高 i9-14900HX CPU+RTX 4070 GPU直逼GPT-4开源模型大泄漏,AI社区炸锅!Mistral CEO自曝是旧模型,OpenAI再败一局?台积电董事长预测:未来15年每瓦GPU性能提升1000倍,GPU晶体管数破万亿!GPU用得太多了,数据中心碰到大麻烦Stability AI发布Stable Code 3B模型,没有GPU也能本地运行2023年IPO律师收费:中位数每单680万元,最高4400万,最低142万!全美肉牛数量降至70年代以来最低,未来几年牛肉价格或将持续上涨《回眸北斋之浮世绘世界》 下穿错内衣显老又显土?这件提拉有型,舒适不勒、不空杯!漫画酥胸轻松get,年轻10倍新中国联邦是如何污辱女性的?老黄祭出新核弹B200!30倍H100单机可训15个GPT-4模型,AI迎新摩尔时代业界首次!搭载英伟达GPU,50倍性能提升!Zilliz发布Milvus 2.4向量数据库AMD推出锐龙8040系列APU,采用Zen4 CPU+RDNA3 GPUResNet引用量破20万!新记录!成功案例∣EB1A法学博士不到100引用量无补件直接获批!2月私募股权基金备案锐减,数量降四成,金额缩水近半;国资、民企LP参投规模比例5.4:1 | 基金月报澳洲大学新生数量降至9年来最低,留学生也在减少!年轻人:学费太贵了
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。