Redian新闻
>
0代码微调大模型火了,只需5步,成本低至150块

0代码微调大模型火了,只需5步,成本低至150块

公众号新闻
明敏 发自 凹非寺
量子位 | 公众号 QbitAI

0代码微调一个大模型,成本不到20美元(人民币约144元)

过程也非常简单,只需5步

如LLaMA、GPT、StableLM等爆火的开源生成式模型,都能搞定。

这就是Monster API,一个最新火起来的API平台。

有人觉得这个开源领域的新工作,能改写AI开发的游戏规则,加速AI应用的速度。

还有人兴奋提问,之后会接入GPT-3/GPT-4吗?

所以,它具体是怎么实现的?

五步零代码搞定

简单理解,Monster API就是将微调步骤尽可能简易化,让开发者不用再手动进行一系列设置,同时也提供便宜的GPU资源及内存优化。

具体过程如下:

第一步,选择一个模型进行微调。

比如LLaMA-7B、GPT-J-6B、StableLM-7B等,Monster API提供了至少10个基础大模型。

第二步,选择或创建微调任务。比如指令微调、文本分类等,或者自定义任务。

第三步,选择一个HuggingFace数据集。

Monster API可以无缝集成HuggingFace数据集,可选择范围很大;还可以根据任务类型推荐数据集。

并且不用自己手动操作,就能自动设置好格式。

第四步,设置超参数。

第五步,检查和提交。

在设置好如上所有步骤后,确定没有错误就可以提交了。

Monster API表示可以通过WandB上的日志来监测任务。

在其博客中写道,用DataBricks Dolly 15k微调LLaMA-7B完成3个epouch,成本仅需不到20美元(折合人民币约144元)。

官网显示,注册用户后会赠送2500积分。会员分为三档,收费分别是每月9美元/29美元/39美元。

除了微调以外,Monster API还提供各种生成式AI的API接口,并表示成本比其他方案低80%。

背后公司已获110万美元融资

消息显示,Monster API背后公司拿下了110万美元的种子前资金(pre-seed funding)。

这家AI初创公司给自己的定位是要做“GPU领域的爱彼迎”,把全世界分散的GPU资源实现灵活调度,让开发者们能够以更低的价格使用。

创始人是两兄弟Gaurav Vij和Saurabh Vij。

其中Gaurav Vij还创立了一家CV公司,正是因为CV公司需要面临巨大的云计算资本,才启发了他们要做这样一个平台。

Saurabh Vij之前是欧洲核研究中心的粒子物理学家,同时也研究分布式计算。

兄弟俩表示在经过多轮技术迭代后,他们优化了消费级GPU在机器学习任务上的性能,使得运行Whisper AI模型的成本相较于AWS平台降低了90%,所以他们就想着为什么不利用这个方法来帮助数以万计的开发者们。

同时他们透露公司的一个客户使用他们的分散的GPU计算资源,已经节省了30万美元。

参考链接:
[1]https://blog.monsterapi.ai/no-code-fine-tuning-llm/

[2]https://www.enterpriseai.news/2023/06/09/monster-api-launches-the-airbnb-of-gpus-with-1-1m-pre-seed/

「AIGC+垂直领域社群」

招募中!

欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群,一起学习、探索、创新AIGC!

请备注您想加入的垂直领域「教育」或「电商零售」,加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
对话中国大模型的最早推行者黄铁军:全球可能只需要三个大模型生态阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl复现2.8分生信文章,TCGA数据库挖掘,0代码搞定6张图繁复不是一种美丽0代码破解GPT-4大脑!外国网友击穿LLM护栏,诱导AI一步步造出炸弹中国港澳:成本低且离家最近的留学复旦新作:单机微调650亿参数大模型;蚂蚁、百度参投AI大模型创企;杭州检方对AI换脸案提起公诉丨AIGC大事日报《行香子 - 贺吉安一中百年华诞》阿里50亿参数的AI画画模型火了,可再厉害的人工智能也无法模仿孩子的画650亿参数,8块GPU就能全参数微调:邱锡鹏团队把大模型门槛打下来了外派故事 (30)约翰和女出租车司机 (下)AIoT情报|突发!美国拟限制中企使用美国云计算;0代码训练GPT5?已证实GPT4可自我迭代;我国IPv6活跃用户数超7亿百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报2023回国 梦牵魂萦的上海南京路,外滩(多图)猿视角: 沸羊羊觉醒失败! 给女友供养6000块补牙, 因没买150块蛋糕身败名裂!叫板董明珠的“空调大王”,成龙都救不了!极少数据就能微调大模型,一文详解LoRA等方法的运作原理Burberry一根雪糕1800块?成本不到10块钱!官方辟谣:假的!网友:差点想说为什么不买一台空调?毕业不用愁!0代码带你复现6图2表非肿瘤SCI(实操性强,附教程)数学能力超ChatGPT,70B开源大模型火了:用AI微调AI,微软全华班出品只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型疫情失业,一家人搬进95㎡森林木屋,生活成本低得惊人!单GPU实现99%ChatGPT性能,「原驼」火了:手机也能微调大模型1月最新出炉!3.776分肿瘤免疫生信SCI,全文6图0代码复现快看!洛杉矶发空调补贴了,买空调最低只需5美元中文医学大模型“本草”(原名华驼):医学知识增强在中文大型语言模型指令微调上的初步探索跑分达ChatGPT的99%,人类难以分辨!开源「原驼」爆火,iPhone都能微调大模型了美国12个薪水高、生活成本低的城市,德州占三个DIY手绘风格油画,只需要简单两步,就能亲手复刻大师作品650亿参数,8块GPU就能全参数微调!邱锡鹏团队把大模型门槛打下来了!Transformer取代者登场!微软、清华刚推出RetNet:成本低、速度快、性能强《夏日的玫瑰》&合唱《天下有情人》四年了,基础开源模型没有真正进步,指令调优大模型评估惊人发现0代码训练GPT-5?MIT微软证实GPT-4涌现自我纠错能力,智能体循环根据反馈让代码迭代!罗兰冈1天3家华人店铺连续被砸!凶手竟是华人老头?!网友谴责:犯罪成本低
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。