随着模型参数的指数型增长,为了加速模型训练和节省高昂资源成本,分布式训练成为主流。然而找到高效的大模型分布式训练方案是一个非常复杂的问题,目前常见的分布式大模型训练方案,都依赖用户人工反复调试以及系统专家的经验来进行配置部署,耗费大量时间与精力,这造成大部分AI开发者使用不友好。
Colossal-AI 提供了业界急需的一套高效易用自动并行系统。相比现有其他手动配置复杂并行策略和修改模型的解决方案,Colossal-AI 仅需增加一行代码,即可让单机训练模型获得分布式训练能力,并且原生支持包括 Hugging Face,Timm 等热门 AI 模型库。同时,对于火爆出圈的ChatGPT,Colossal-AI在最新的开源方案中也给出了明确的支持,提供了首个开源低成本复现 ChatGPT 完整流程,1.62GB显存即可体验,单机训练实现7.73倍的提速,仅需一行代码便可极大降低单卡推理和微调任务的门槛。Colossal-AI支持单卡、单机多卡、1750 亿参数等多个版本,用户可以从 Hugging Face 导入 OPT,GPT-3,BLOOM 等多种预训练大模型。Colossal-AI致力于降低 AI 开发者的使用分布式技术训练推理和微调大模型门槛,提供高效易用自动并行系统让用户轻松使用上复杂的并行策略,支持低成本复现ChatGPT流程让每一位用户都可以体验到大模型的魅力,希望每一家企业都可以通过大模型实现降本增效,体会到AI赋能带来的力量。
欢迎大家提前试用,开源地址:https://github.com/hpcaitech/ColossalAI
北京时间 2 月 20 日 19:00-21:00,机器之心最新一期线上分享邀请到了潞晨科技技术总监柳泓鑫和潞晨科技资深 AI 系统工程师刘育良,为大家解读 Colossal-AI 的技术细节。分享主题:Colossal-AI助力自动分布式部署,加速大模型训练,并开源ChatGPT复现流程!
分享摘要:为极大降低 AI 开发者对大模型的使用门槛,Colossal-AI开源方案为业界提供了一套高效易用自动并行系统,大幅降低AI大模型训练的门槛,加快AI大模型部署和应用,同时为用户支持低成本复现 ChatGPT 完整流程,1.62GB显存即可体验。柳泓鑫,新加坡国立大学硕士,师从尤洋教授,对大规模深度学习、AI System等领域有深入研究。现任潞晨科技技术总监,Colossal-AI最新开源方案 ChatGPT 完整复现流程主要贡献者。
刘育良,16岁考入南开大学软件工程专业,硕士毕业于新南威尔士大学人工智能专业。现任潞晨科技资深AI系统工程师,对深度学习分布式训练有深入研究,Colossal-AI自动并行方案主要贡献者。
GitHub 链接:https://github.com/hpcaitech/ColossalAI直播时间:2 月 20 日 19:00-21:00会后材料:如果您希望获取嘉宾分享PPT与更多关于Colossal-AI的资料,请点击「阅读原文」填写邮箱地址等信息,会后为您发送。
交流群:本次直播有 QA 环节,欢迎加入本次直播交流群探讨交流。