Redian新闻
>
爆火Llama 2一周请求下载超15万,有人开源了Rust实现版本

爆火Llama 2一周请求下载超15万,有人开源了Rust实现版本

公众号新闻
机器之心报道
编辑:陈萍

研究者对 Llama 2 的二次开发项目是越来越多了。


前些天,Meta 发布的免费可商用版本  Llama 2,可谓在 AI 界引起了巨大的轰动。 


Meta 一口气发布了多个模型系列:包含 70 亿、130 亿和 700 亿三种参数变体,此外还训练了一个 340 亿参数变体。



公布的测评结果显示,Llama 2 在包括推理、编码、精通性和知识测试等许多外部基准测试中都优于其他开源语言模型。


不同于 ChatGPT、GPT-4 等闭源模型,由于 Llama 2 可用于商业目的,一经发布就吸引了一大波 AI 研究人员的注意。由于任何人都可以通过在 Meta 网站上填写表格来请求下载 Llama 2,根据官方消息,自发布以来,Llama 2 一周内就有超过 15 万次的下载请求。Meta 对于这一数字的描述是难以置信,并且用户请求数量还在增长。


Llama 2 请求地址:https://ai.meta.com/resources/models-and-libraries/llama-downloads/


来源:https://ai.meta.com/blog/llama-2-update/?utm_source=twitter&utm_medium=organic_social&utm_campaign=llama2&utm_content=card


随着 Llama 2 的逐渐走红,大家对它的二次开发开始流行起来。前几天,OpenAI 科学家 Karpathy 利用周末时间开发了一个明星项目 llama2.c,借助 GPT-4,该项目仅用 500 行 C 语言就实现了对 Llama 2 baby 模型的推理。该项目可以在苹果 M1 笔记本上每秒输出 98 个 token。


刚刚,又有一个和 LLaMA 2 相关的项目 llama2.rs 开始得到大家的关注,项目作者是来自康奈尔大学的助理教授 Alexander Rush。


总结而言,该项目主要是用 Rust 实现 Llama2,结果表明,用这种方式实现的 LLaMA 2 非常安全,而且很快。值得一提的是,该项目用到了 Karpathy 的 llama2.c 项目的 Rust 端口



项目地址:https://github.com/srush/llama2.rs


深度学习三巨头之一的 Yann LeCun 也宣传了一波:



接下来我们看看,如何使用 llama2.rs。


构建 llama2.rs 非常简单,只需一行代码:


> cargo build --release


运行程序如下,显示 tok/s 为 0.92618316:


> target/release/llama2_rs ../llama2.c/llama2_7b.bin 0.0 11 "The only thing"The only thing that is certain in life is change.achieved tok/s: 0.92618316


作为对比,下面是作者在电脑上运行原始 llama2.c,显示 tok/s 为 0.139889:


> ./run llama2_7b.bin 0.0 11 "The only thing"The only thing that is certain in life is change.achieved tok/s: 0.139889


在谈到为何开发这一项目时,Alexander Rush 表示,自己只是想做一些关于 Rust 的练习,与此同时,学习该如何进行程序移植,比如内存映射、并行处理和一些数学技巧。


接下来,Alexander Rush 打算尝试移植 minitorch,感兴趣的读者可以关注一下了。


「Llama 2 大模型算法与应用实践」——机器之心 AI 技术论坛来了!
8月26日,与资深大模型技术专家一起相聚北京,拆解 Llama 2 算法与应用,动手搭建一个私有大模型。
论坛为期 1 天,内容包括 Llama 2 算法解读、基于 Llama 2 开发中文大模型、Llama 2 案例解读和应用实践等。通过本场分享,你将系统了解到 Llama 2 背后的技术以及潜在的应用场景,为即将到来的「大模型安卓时代」做好准备。

售票通道已开启,机器之心为读者朋友准备了「早鸟优惠」,赶快扫描下图二维码领取限时福利吧!


© THE END 
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
Rust 基础系列 #8:编写里程碑 Rust 程序 | Linux 中国一个音乐弥漫的午后阿里开源了一个新东西,上GitHub热榜了!JetBrains发布独立Rust IDE:RustRoverPython 失宠!Hugging Face 用 Rust 新写了一个 ML 框架,现已低调开源太卷了,京东、微信与微博最新缓存架构直接开源了。。。2023夏游江南(中)Erklärung zur ZusammenarbeitGPT-4写代码不如ChatGPT,误用率高达62%!加州大学两位华人开源代码可靠性基准RobustAPI基于 Rust 的高性能编辑器 Zed,在玩一种很新的 “开源”Fabulous拉斯维加斯印象Jetbrains发布全新 Rust IDE 命名RustRover,Linux 等可免费下载也许只有Python之父才能救得了Rust开源了!UniControl:可控视觉生成的统一扩散模型马拉松赛前焦虑症全面超越LLaMA2,月下载量超三百万,国产开源大模型如何成为新晋顶流?百川智能发布Baichuan2大模型:全面领先Llama2,训练切片也开源了阿里开源了一个新东西,上 GitHub 热榜了!Rust 社区管理再起“内讧”:RustConf 粗暴撤换主讲人事态升级引发多人出走顶级黑客组织出手,将推出新的反数据收集开源框架Veilid:用Rust编写,已有10万行代码北交大TransGPT,开源了!Next.js + Rust 革新全栈开发,Rust没那么难再见了R语言!生信套路大公开,学渣也能快速发表SCI!ChatDev,开源了!基于Rust的高性能编辑器Zed,在玩一种很新的 “开源”号称史上最强、击败LLaMA的大模型开源了,却因为许可证被骂CBS取消了Rolling录取?!是好是坏?世界各国人眼中的中国第一美女:差异不是一般的大啊Rust 基础系列 #7: 在 Rust 中使用循环 | Linux 中国用 Rust 编写,已有 10 万行代码:顶级黑客组织出手,将推出新的反数据收集开源框架 Veilid爆火「视频版ControlNet」开源了!靠提示词精准换画风,全华人团队出品交了R1,有哪些经验教训可以用到R2 | 周六Live Podcast性能碾压Llama 2,全球下载量超500万,百川智能开源模型凭什么?新项目爆火,GPT 开源了!让作者月入2万的App,免费开源了!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。