Redian新闻
>
GPT-4里套娃LLaMA 2!OpenAI创始成员周末爆改「羊驼宝宝」,GitHub一日千星

GPT-4里套娃LLaMA 2!OpenAI创始成员周末爆改「羊驼宝宝」,GitHub一日千星

公众号新闻
梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

大神仅花一个周末训练微型LLaMA 2,并移植到C语言

推理代码只有500行,在苹果M1笔记本上做到每秒输出98个token

作者是OpenAI创始成员Andrej Karpathy,他把这个项目叫做Baby LLaMA 2(羊驼宝宝)

虽然它只有1500万参数,下载下来也只有58MB,但是已经能流畅讲故事。

所有推理代码可以放在C语言单文件上,没有任何依赖,除了能在笔记本CPU上跑,还迅速被网友接力开发出了各种玩法。

llama.cpp的作者Georgi Gerganov搞出了直接在浏览器里运行的版本。

提示工程师Alex Volkov甚至做到了在GPT-4代码解释器里跑Baby LLaMA 2。

大模型套娃小模型,成了。

羊驼宝宝诞生记

据Karpathy分享,做这个项目的灵感正是来自llama.cpp。

训练代码来自之前他自己开发的nanoGPT,并修改成LLaMA 2架构。

推理代码直接开源在GitHub上了,不到24小时就狂揽1500+星。

训练数据集TinyStories则来自微软前一阵的研究。

2023新视野数学奖得主Ronen Eldan、2023斯隆研究奖得主李远志联手,验证了1000万参数以下的小模型,在垂直数据上训练也可以学会正确的语法、生成流畅的故事、甚至获得推理能力。

此外,开发过程中还有一个插曲。

Karpathy很久不写C语言已经生疏了,但是在GPT-4的帮助下,还是只用一个周末就完成了全部工作。

对此,英伟达科学家Jim Fan评价为:现象级

最初,在CPU单线程运行、fp32推理精度下,Baby LLaMA 2每秒只能生成18个token。

在编译上使用一些优化技巧以后,直接提升到每秒98个token。

优化之路还未停止。

有人提出,可以通过GCC编译器的-funsafe-math-optimizations模式再次提速6倍

除了编译方面外,也有人提议下一步增加LoRA、Flash Attention等模型层面流行的优化方法。

Baby LLaMA 2一路火到Hacker News社区,也引发了更多的讨论。

有人提出,现在虽然只是一个概念验证,但本地运行的语言模型真的很令人兴奋。

虽然无法达到在云端GPU集群上托管的大模型的相同功能,但可以实现的玩法太多了。

在各种优化方法加持下,karpathy也透露已经开始尝试训练更大的模型,并表示:

70亿参数也许触手可及。

GitHub:
https://github.com/karpathy/llama2.c

在浏览器运行Baby LLaMA 2:
https://ggerganov.com/llama2.c

参考链接:
[1]
https://twitter.com/karpathy/status/1683143097604243456
[2]https://twitter.com/ggerganov/status/1683174252990660610
[3]https://twitter.com/altryne/status/1683222517719384065
[4]https://news.ycombinator.com/item?id=36838051

「AIGC算力全景与趋势报告 · 量子位智库」下载

AIGC时代,算力成为「硬通货」。当前大模型的发展对算力产生新的需求,算力行业迎来变革机会。机遇当前,量子位智库发布《AIGC算力全景与趋势报告》,扫描下方二维码即可查看完整报告。

8月上旬,我们将举办「量子位AIGC行业沙龙——AIGC时代的算力基石」,欢迎感兴趣的企业联系~

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
美国的隔壁老王和中国的隔壁老王之比较篇马斯克xAI创始成员国内首发声:ChatGPT时代「乱世出英雄」,下一步要多用数学科学数据训练Python 吞噬世界,GPT 吞噬 Python!ChatGPT 上线最强应用OpenAI联创Karpathy爱上羊驼:纯C代码实现婴儿Llama2,MacBook可运行,已揽1.6k星纪念丨一直被替代,“老鹰乐队”创始成员兰迪·迈斯纳去世13条咒语挖掘GPT-4最大潜力,Github万星AI导师火了,网友:隔行再也不隔山了周末爆雷!50岁A股实控人,被立案调查张译夺华表影帝实现大满贯,娶央视美女主持婚后无子,距离影史第一人只差这步Python 吞噬世界,GPT 吞噬 Python!ChatGPT 上线最强应用:分析数据、生成代码都精通AI「复刻」现实女友爆火!国外小哥开源GirlfriendGPT,GitHub已获1.3k星GPT-5不远了!OpenAI推出网络爬虫GPTBot,自动抓取数据,可选择性关闭周末爆利好24小时内、200美元复制RLHF过程,斯坦福开源「羊驼农场」模拟器Python吞噬世界,GPT吞噬Python!ChatGPT 上线最强应用:分析数据、生成代码都精通对对子12. 不染红尘愁半点。对下联。650亿参数,训练飙升38%!LLaMA基础大模型复刻最佳实践开源,GitHub已获30k星OpenAI创始人:面临GPU短缺恐慌,GPT-3或将开源!GitHub热榜登顶:开源版GPT-4代码解释器,可安装任意Python库,本地终端运行ChatGPT 又断网了!OpenAI 暂时下线 ChatGPT 搜索功能,只因绕过付费墙?「羊驼」们走到哪一步了?研究表明:最好的能达到GPT-4性能的68%GPT现状:OpenAI创始成员揭秘大模型内部原理终于找到ChatGPT智商下降的原因了!OpenAI侧面回应,GPT可能真被你们玩坏了?Copilot Chat 推出公开测试版,GitHub:花费数月的单元测试成为过去开源多模态大模型哪家强?TOP12榜单来了,GitHub揽获2.2k+星OpenAI 已为 GPT-5 申请商标,GPT-5 要来了?羊驼进化成鲸鱼,Meta把对齐「自动化」,Humpback击败现有全部LLaMa模型MetaGPT爆火出圈!2美元就能当老板,GitHub狂揽11.2k星,AI智能体「多面手」诞生GPT-Engineer一夜爆火!一个提示生成整个代码库,GitHub狂飙19k星终于找到 ChatGPT “智商”下降的原因了!OpenAI 侧面回应,GPT 可能真被你们玩坏了?OpenAI 又赢麻了!谷歌 DeepMind 创始人刚称 Gemini 能碾压 GPT-4,OpenAI 的挖人大计就出炉了重训「羊驼」大模型并彻底开放商用,UC伯克利博士生:Meta不愿做就自己做今朝金鱼OpenAI科学家Karpathy周末造出「婴儿Llama2」!GPT-4辅助写500行纯C代码,速揽1.6k星人人玩转Llama 2!Meta正式官宣免费用,微调羊驼指南大全集联合国和累进制选举
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。