Redian新闻
>
苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型

苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型

公众号新闻
萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

苹果M系列芯片专属的机器学习框架,开源即爆火!

现在,用上这个框架,你就能直接在苹果GPU上跑70亿参数大模型、训练Transformer模型或是搞LoRA微调。

它由苹果官方发布,风格与PyTorch相似,不过并不基于任何已有框架实现。

LeCun等大佬纷纷赶来点赞转发。

英伟达高级AI科学家Jim Fan赞叹称:

这应该是目前苹果在开源AI开源上最大的动作了。

甚至还有网友动起了iPhone上A芯的念头(手动狗头)

所以,这个框架究竟长啥样?

参考多个ML框架设计

这个新框架名叫MLX,有探索机器学习(ml-explore)的意思。

从功能来看,MLX主要有以下几点特性:

API熟悉(包括C++ API、类似NumPy的Python API以及一些高级功能包近似于PyTorch的API)、可组合函数变换、惰性计算、动态图构建、多设备可用、统一内存。

框架作者Awni Hannun介绍,之所以MLX不直接基于PyTorch实现,主要有几个方面的考量。

首先是因为,MLX框架是给苹果芯片设计的。

苹果芯片在采用了一些独特的设计,例如统一内存,这些设计在框架中都可以被利用。

然后,MLX框架也参考了不同机器学习框架的优势,包括NumPy、PyTorch、Jax和ArrayFire等。

例如JAX中可组合的函数转换,就被加进了MLX的设计中,但graph(计算图)仍然是动态构建的。

除此之外,作者认为MLX也有一些属于自己的特性,如简单、灵活和多样性等。

因此,MLX在功能和设计上与PyTorch等经典框架不完全一样,有一些“自己的style”。

如果你手上有苹果M芯电脑的话,现在就可以上手一试跑AI模型了。

苹果电脑M系列芯片才能用

目前,官方给出了5类MLX的使用参考案例:

  • Transformer架构语言模型的训练

  • LLaMAMistral进行长文本生成

  • LoRA进行参数微调

  • Stable Diffusion进行图像生成

  • Whisper进行语音识别

作者们还在GitHub上放出了基于Stable Diffusion对比的PyTorch和MLX的性能:

要是对这几个AI模型感兴趣,装好MLX之后就可以直接上手试玩了。

作者给出了一系列手把手的教程,教你如何在苹果电脑上运行MLX框架。

首先是pip install mlx,安装一下框架:

我们也在苹果M芯电脑上尝试了一下,可以成功安装:

值得一提的是,安装前记得检查一下你的苹果电脑,各种环境和操作系统是否都搞好了。

而且芯片必须是苹果自研的M系列芯片,可以用这个口令检查一下:

如果是英特尔平台,也是用不了MLX的:

搞定之后,git clone一个副本,就可以在样例里面找到自己想玩的模型,尝试上手运行了:

这里跑一个LLaMA试试:

然后就可以开始问问题了,例如波尔查诺-魏尔斯特拉斯定理是什么等等,LLaMA就能在终端给你解答:

LightningAI的Sebastian Raschka表示,这个框架看起来非常酷,希望能看到更多PyTorch与MLX在macOS上的性能对比。

除此之外,LLaMA在MLX上的实现细节也非常有意思:

还有不少苹果用户表示高兴:H100稀缺的情况下,终于可以用M3 Max来搞事了。

你试用过MLX了吗?感觉如何?

参考链接:
[1]https://github.com/ml-explore/mlx

[2]https://twitter.com/awnihannun/status/1732184443451019431

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
长跑7年,知名品牌IPO终止!刚斥资6亿元杭州拿地腾讯发表多模态大模型最新综述,从26个主流大模型看多模态效果提升关键方法路径“另类”,苹果大模型蓄势待发混合专家系统里根本没专家?开源MoE模型论文引网友热议为大模型恶补数学,上交开源MathPile语料库,95亿tokens,还可商用黎曼假设的秘密Stability AI发布全新代码模型Stable Code 3B!媲美70亿Code Llama,没GPU也能跑突发!2100亿巨头大动作:狠砸100亿孙正义将再有大动作:WeWork倒下之后,软银何去何从?性能逼近GPT-4,开源Mistral-Medium意外泄露?CEO最新回应来了ICLR 2024 | 机器人领域首个开源视觉-语言操作大模型!RoboFlamingo框架激发开源VLMs更大潜能UC伯克利团队开源MemGPT大模型上下文内存管理方案;AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源首个国产开源MoE大模型来了!性能媲美Llama 2-7B,计算量降低60%对话杨元庆:AI PC,个人大模型最佳载体一周国际财经|日元贬值,日本“老三”地位难保?马斯克大动作:X平台将转型约会+数字银行;“木头姐”发帖质疑美国数据失真最好7B模型再易主!打败700亿LLaMA2,苹果电脑就能跑|开源免费聊聊我心中浩气长存的《黑道家族》 ? 世间再无Tony SopranoStability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑机器人领域首个开源视觉-语言操作大模型,RoboFlamingo框架激发开源VLMs更大潜能Llama 2第一、GPT-4第三!斯坦福大模型最新测评出炉全球首款3nm芯片塞进电脑,苹果M3炸翻全场!128GB巨量内存,大模型单机可跑,性能最高飙升80%零一万物 Yi 大模型最新评测,英语能力仅次于 GPT-4移民生活(26)由聂树斌案谈到严打引入大语言模型、首个支持国产算力生态,全新开源RL框架RLLTE来了720亿参数大模型都拿来开源了!通义千问开源全家桶,最小18亿模型端侧都能跑双林奇案录第三部之昭雪嘉州: 第七节国产大模型开源一哥再登场,最强双语LLM「全家桶」级开源!340亿参数超越Llama2-70B滴滴自动驾驶超亿元投资北醒光子;上海:开展射频基带芯片、天线、专用算法等关键技术研发,形成高性价比终端制造能力丨智能制造日报220亿晶体管,IBM机器学习专用处理器NorthPole,能效25倍提升你的GPU能跑Llama 2等大模型吗?用这个开源项目上手测一测红色日记 读世界史 4.29-30"多伦多太落后了"!市政府宣布大动作:打造24小时不夜城!扩散模型更懂复杂提示词!Pika北大斯坦福开源新框架,利用LLM提升理解力首款生成式AI移动芯片天玑9300:能跑330亿参数大模型曝光!姚期智带领团队突破大模型“思维”框架,让机器思考更接近人类...
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。