首个中文Stable Diffusion模型背后的技术：IDEA研究院封神榜团队揭秘

2022-11-09 05:11

近年来，随着大模型在自然语言处理、计算机视觉等多个领域兴起，认知智能正在经历范式上的变化。借助大规模的数据以及庞大的参数量，这些模型展现出能够有效处理各种任务的特征，并正在以惊人的速度被部署到各个专业领域中，对社会和经济发展产生深远的影响。

但是目前中文社区出现了某种停滞不前的现象，因为模型的体量已经从原本的百万参数飞跃至千亿级别，一些高校和传统公司并不具备足够的算力，也缺少有效的基础设施帮助他们训练和使用模型。因此，要推动人工智能技术进一步发展，坚实的基础设施尤为重要。

在这个背景下，IDEA 研究院封神榜团队在过去快速积累的基础上，已经开源超过 86 个预训练模型，其中一个里程碑事件，就是近期刚刚开源的以中文为主的首个中文 Stable Diffusion 模型 “太乙”，让 AI 更懂中文，也让中文的世界真正拥有具备中国文化内核的 AIGC 模型。

至于Stable Diffusion，最近可是火出了圈，其模型的开源，催生了众多 AI 绘画的应用，得益于 Stability AI 的开源精神，这一创变推动了整个以英文为主的下游文生图生态的蓬勃发展。

然而在国内，大部分团队主要是基于翻译 API + 英文 Stable Diffusion 模型进行开发，由于中英文之间所得存在文化差异导致遇到中文独特的叙事和表达时，这种模型就很难给出正确匹配的图片内容。“太乙”的开源可谓是弥补了这一缺憾。

机器之心上周发布的相关文章引起了国内 AI 社区的极大关注（参考：首个中文Stable Diffusion模型开源，IDEA研究院封神榜团队开启中文AI艺术时代）。为了方便读者了解此项目，机器之心最新一期机动组直播邀请到了封神榜团队在周四线上分享揭秘首个中文 Stable Diffusion 模型背后的关键技术。欢迎对 AIGC 感兴趣的小伙伴前来交流。