首个中文Stable Diffusion模型背后的技术:IDEA研究院封神榜团队揭秘
近年来,随着大模型在自然语言处理、计算机视觉等多个领域兴起,认知智能正在经历范式上的变化。借助大规模的数据以及庞大的参数量,这些模型展现出能够有效处理各种任务的特征,并正在以惊人的速度被部署到各个专业领域中,对社会和经济发展产生深远的影响。
但是目前中文社区出现了某种停滞不前的现象,因为模型的体量已经从原本的百万参数飞跃至千亿级别,一些高校和传统公司并不具备足够的算力,也缺少有效的基础设施帮助他们训练和使用模型。因此,要推动人工智能技术进一步发展,坚实的基础设施尤为重要。
在这个背景下,IDEA 研究院封神榜团队在过去快速积累的基础上,已经开源超过 86 个预训练模型,其中一个里程碑事件,就是近期刚刚开源的以中文为主的首个中文 Stable Diffusion 模型 “太乙”,让 AI 更懂中文,也让中文的世界真正拥有具备中国文化内核的 AIGC 模型。
至于Stable Diffusion,最近可是火出了圈,其模型的开源,催生了众多 AI 绘画的应用,得益于 Stability AI 的开源精神,这一创变推动了整个以英文为主的下游文生图生态的蓬勃发展。
然而在国内,大部分团队主要是基于翻译 API + 英文 Stable Diffusion 模型进行开发,由于中英文之间所得存在文化差异导致遇到中文独特的叙事和表达时,这种模型就很难给出正确匹配的图片内容。“太乙”的开源可谓是弥补了这一缺憾。
机器之心上周发布的相关文章引起了国内 AI 社区的极大关注(参考:首个中文Stable Diffusion模型开源,IDEA研究院封神榜团队开启中文AI艺术时代)。为了方便读者了解此项目,机器之心最新一期机动组直播邀请到了封神榜团队在周四线上分享揭秘首个中文 Stable Diffusion 模型背后的关键技术。欢迎对 AIGC 感兴趣的小伙伴前来交流。
分享主题:首个中文开源 Stable Diffusion 团队技术揭秘:中文语境下的AIGC
分享摘要:全面讲解太乙系列模型从模型的生产到应用。该分享从训练,微调和加速等角度揭秘封神榜开源体系之一的太乙系列(多模态系列)模型是如何生产的。基于该团队训练后开源的权重,讲解如何推理加速以及如何部署在 webui 和 dreambooth 等应用上。
分享时间:北京时间 11 月 10 日 19:00-20:00
分享嘉宾
甘如饴,IDEA 研究院封神榜团队负责人,基础算法资深研究员。 王军杰,IDEA 研究院封神榜团队成员,现就读于早稻田大学攻读博士学位,清华大学客座学生(指导老师:杨余久)。 李夏禹,IDEA 研究院封神榜团队成员,基础算法资深研究员。 高昕宇,IDEA 研究院封神榜团队成员,基础算法资深研究员。 陈伟峰,IDEA 研究院封神榜团队成员,现就读于中山大学硕士学位。
相关链接:
封神榜论文(中英双语):https://arxiv.org/abs/2209.02970 IDEA研究院官网:https://www.idea.edu.cn/ 封神榜大模型开源体系:https://www.idea.edu.cn/fengshenbang-lm.html 封神榜模型:https://huggingface.co/IDEA-CCNL 封神框架:https://github.com/IDEA-CCNL/Fengshenbang-LM
加群看直播
直播间:关注机器之心机动组视频号,立即预约。
交流群:本次直播设有 QA 环节,欢迎加入本次直播交流群探讨交流。
如群已超出人数限制,请添加机器之心小助手:syncedai4、syncedai5或 syncedai6,备注「IDEA」即可加入。
微信扫码关注该文公众号作者