Redian新闻
>
3w+星标项目大佬创业:树莓派即可运行大模型,已获GitHub前CEO投资

3w+星标项目大佬创业:树莓派即可运行大模型,已获GitHub前CEO投资

公众号新闻
杨净 发自 凹非寺
量子位 | 公众号 QbitAI

资深开发大佬,终于忍不住自己出来创业了。

Georgi Gerganov,今年三月曾开源了llama.cpp项目,GitHub上已破三万星标,要知道Stable Diffusion也不过8.8k。

这个项目能让开发者在没有GPU情况下运行Meta的LLaMA模型,即便是在树莓派、MacBook上运行大模型也通通不在话下~

在 M2 Max 上以 40 tok/s 的速度运行 7B LLaMA

甚至还成功吸引了小扎的注意:Meta也在运行llama.cpp

可能由于反响太好,这位大哥决定把背后核心纯C语言框架ggml拿出来创业:原本是几月前的副业项目。

在官宣前这家公司就已经获得来自GitHub前CEONat Friedman、Y Combinator合伙人Daniel Gross的种子前投资。

消息一出,众多开发者赶来祝贺。

其中不乏一些坚定的拥护者:ggml正在将大模型普及到边缘设备。

没过多久就有人建议:苹果应该将它收购了。(狗头)

llama.cpp作者创业

ggml,是一个纯C语言编写的张量库,可帮助开发者在消费级硬件上运行大模型,GitHub星标数达到4.4k。

由于加速效果惊人,一下子收获了不少开发者的支持。

By the way,ggml的gg恰好是他名字的缩写。

大哥自己的两个上万星标的项目llama.cpp和whisper.cpp都使用了它。


后者是为OpenAI的Whisper自动语音识别模型开发的加速方案,可在Mac、Windows、Linux、iOS、安卓、树莓派以及web上运行。

使用whisper.cpp在 树莓派上检测短语音命令

不少初创公司,比如主打生活搜索引擎的rewind都使用了这套解决方案。

还有两个项目同时在终端上运行。

在单个M1Pro上同时运行4个13B LLaMA+Whisper Small实例

根据个人介绍,ggml张量库具有以下这些特点:

支持 16bit 浮点数;支持整数量化(包括 4 位、5 位、8 位);自动微分;内置优化算法(例如 ADAM、L-BFGS);为苹果芯片设置特定优化;在 x86 架构上使用AVX / AVX2 Intrinsic;通过WebAssembly和WASM SIMD提供Web支持;无第三方依赖;运行时零内存分配;支持指导型语言输出……

目前这个库以及相关项目都是免费开源,开发过程也全公开;当然也不排除开发授权给一些商业用途的项目。

用C/C++重写神经网络代码

而这背后的开发大佬Georgi Gerganov也值得说道说道。

他的个人网站十分简单直接,甩出各种开源项目,除此之外别无其他。可以看出,他是C/C++的狂热爱好者,信仰Vim。

此前,他曾用C/C++语言重写神经网络推理代码,这样几乎不依赖于其他库,以此提升效率。至于llama.cpp也是他一晚上Hacking出来的。

除此之外,他还有一些有意思的项目。

比如检查键盘是否可以通过麦克风窃听、猜Hacker News的标题,Wordle克隆版等等。

One More Thing

值得一提的是,背后的这两个投资者也有点意思。

他们还专门给创业者提供算力集群,只需在网站上申请即可。这波是在Next Level上了~

参考链接:
[1]https://ggerganov.com/

[2]http://ggml.ai/
[3]https://twitter.com/ggerganov

「AIGC+垂直领域社群」

招募中!

欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群,一起学习、探索、创新AIGC!

请备注您想加入的垂直领域「教育」或「电商零售」,加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
GitHub放大招!CEO现场挑战18分钟开发小游戏,人还在台上网友已经玩到了5057 血壮山河之武汉会战 鏖战幕府山 26谷歌终于能与OpenAI 打擂台了!全新PaLM 2比肩GPT-4:一部手机就可运行,精通Python等20种语言老黄发布最强AIGC芯片!内存容量暴增近50%,可运行任意大模型,“生成式AI的iPhone时刻已来”英伟达AI芯片劲敌来了!AMD推出MI300X,可运行多达800亿参数模型坚持做行业大模型,竹间智能给大模型造了一座「模型工厂」阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl黑马天启CEO杨昕:天启科创大模型正式发布,未来可能会有几十万家企业受益于大模型强生前CEO投资,AI初创融资6000万美元,已与12家大型制药公司达成合作大模型开发者必备手册:这些数字值得记住 | GitHub 1200星给大模型持久记忆!GitHub 2万星向量数据库云服务升级,国内云产品7月上线ChatGPT访问骤降,国产大模型弯道超车机会来了?2万星GitHub项目亮剑,国内产品7月上线《月光如水》&《种花闲》AI「复刻」现实女友爆火!国外小哥开源GirlfriendGPT,GitHub已获1.3k星OpenAI联创Karpathy爱上羊驼:纯C代码实现婴儿Llama2,MacBook可运行,已揽1.6k星王小川大模型2个月交卷!开源7B规模里中文最强,GitHub揽星2.2k心情就像风一样自由---我们不需要枚举用 Lua 控制你的树莓派 | Linux 中国GitHub Copilot主创离职创业!抱怨项目奖金仅2万刀,自立门户打造日常生活AI助手GitHub Copilot 主创离职创业!抱怨项目奖金仅 2 万刀,自立门户打造日常生活 AI 助手树莓派的五种最奇特的用途 | Linux 中国开源多模态大模型哪家强?TOP12榜单来了,GitHub揽获2.2k+星网易云音乐前CEO朱一闻进入AI+教育领域创业|36氪独家彻底抛弃Transformer,八金刚之一再创业!联手前谷歌Brain大佬创建自然启发智能模型呱呱随笔:远离危险与试探,由我吃牛油果差点噎死说起张庭夫妇又有新动作;安慕希回应主播直播间骂人;京东前CEO徐雷称不会打工和创业;特斯拉100GB数据泄露原因查明...基于树莓派的蓝牙协议抓包BB鸭 | ​iPhone 15数据线曝光;京东前CEO徐雷不创业;福岛核污染水排海日期公布;网约车不得以不正当价格行为扰乱市场官宣APP来了!手机也能原生运行大模型,应用商店已上架百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报七绝 翻看老照片只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型在不到 30 分钟内构建一个树莓派监控仪表盘 | Linux 中国树莓派上运行 Stable Diffusion,260MB 的 RAM「hold」住 10 亿参数大模型650亿参数,训练飙升38%!LLaMA基础大模型复刻最佳实践开源,GitHub已获30k星
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。