Redian新闻
>
图像生成模型 Stable Diffusion 现已开源 | Linux 中国

图像生成模型 Stable Diffusion 现已开源 | Linux 中国

科技
 
导读:当输入一个文字描述时,Stable Diffusion 可以生成 512×512 像素的图像,这些图像如相片般真实,反映了文字描述的场景。
本文字数:1499,阅读时长大约:2分钟

Stable Diffusion 是一个“文本到图像”的人工智能模型。近日,Stable AI 公司向公众开放了它的预训练模型权重。当输入一个文字描述时,Stable Diffusion 可以生成 512×512 像素的图像,这些图像如相片般真实,反映了文字描述的场景。

这个项目先是经历了早期的代码发布,而后又向研究界有限制地发布了模型权重,现在模型权重已经向公众开放。对于最新版本,任何人都可以在为普通消费者设计的硬件上下载和使用 Stable Diffusion。该模型不仅支持文本到图像的生成,而且还支持图像到图像的风格转换和放大。与之一同发布的还有 DreamStudio 测试版,这是一个用于该模型的 API 和 Web 用户界面。

Stable AI 公司表示:

“Stable Diffusion 是一个文本到图像的模型,它将使数十亿人在几秒钟内创造出令人惊叹的艺术。它在速度和质量上的突破意味着它可以在消费者级的 GPU 上运行。这将允许研究人员和公众在一系列条件下运行它,并使图像生成普及化。我们期待着有围绕这个模型和其他模型的开放生态系统出现,以真正探索潜伏空间的边界。”

Latent Diffusion 模型(LDM)是 Stable Diffusion 模型建立的一种图像生成方法。LDM 通过在潜伏表示空间(latent representation space)中迭代“去噪”输入来创建图像,然后将表示解码为完整的图像,这与其他著名的图像合成技术,如生成对抗网络(GAN)和 DALL-E 采用的自动回归方法不同。最近的 IEEE/CVF 计算机视觉和模式识别会议(CVPR)上有一篇关于 LDM 的论文,它是由慕尼黑路德维希-马克西米利安大学的机器视觉和学习研究小组创建的。今年早些时候,InfoQ 也报道的另一个基于扩散的图片生成 AI 是谷歌的 Imagen 模型。

Stable Diffusion 可以支持众多的操作。与 DALL-E 类似,它可以生成一个高质量的图像,并使其完全符合所需图像的文字描述。我们也可以使用一个直观的草图和所需图像的文字描述,从而创建一个看起来很真实的图像。类似的“图像到图像”的能力可以在 Meta AI 的 Make-A-Scene 模型中找到,该模型刚发布不久。

一些人公开分享了 Stable Diffusion 创建的照片的例子,Stable AI 的首席开发人员 Katherine Crowson 也在 Twitter 上分享了许多照片。毫无疑问,基于人工智能的图片合成技术将对艺术家和艺术界产生影响,这令一些观察家感到担忧。值得注意的是,在 Stable Diffusion 发布的同一周,一幅由人工智能生成的作品在科罗拉多州博览会的艺术竞赛中获得了最高荣誉。

Stable Diffusion 的源代码可以在 GitHub🔗 github.com 上查阅。


via: https://www.opensourceforu.com/2022/09/image-generation-model-stable-diffusion-is-now-open-source/

作者:Laveesh Kocher 选题:lkxed 译者:lkxed 校对:wxy

本文由 LCTT 原创编译,Linux中国 荣誉推出


LCTT 译者 :六开箱
🌟🌟🌟🌟🌟
翻译: 103.0 篇
|
贡献: 179 天
2022-03-16
2022-09-10
https://linux.cn/lctt/lkxed
欢迎遵照 CC-BY-SA 协议规定转载,
如需转载,请在文章下留言 “转载:公众号名称”,
我们将为您添加白名单,授权“转载文章时可以修改”。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
3D版DALL-E来了!谷歌发布文本3D生成模型DreamFusion,给一个文本提示就能生成3D模型!「最牛AI艺术家」Stable Diffusion有多值钱?种子轮融资即晋升独角兽!ProGAN、StyleGAN、Diffusion GAN…你都掌握了吗?一文总结图像生成必备经典模型(一)印象笔记的替代品 Notesnook 现已开源 | Linux 中国把Stable Diffusion模型塞进iPhone里,做成APP一分钟出图1.01亿美元融资,Stable Diffusion背后的公司两年迅速成长为AI内容生成独角兽当下最强的 AI art 生成模型 Stable Diffusion 最全面介绍Stable Diffusion背后公司再融1亿美金,网友:资本的盛宴,艺术家却分不到一杯羹?1.01亿美元融资,为Stable Diffusion捐赠算力的公司两年成为独角兽现世姻缘 (十)浙大开源快速扩散语音合成模型FastDiff和ProDiff在夕阳里令人惊艳的小镇格伦赛德AI绘画神器Stable Diffusion的疯狂与危险首个中文Stable Diffusion模型开源,IDEA研究院封神榜团队开启中文AI艺术时代Blackbox:极简主义 Linux 用户的美观终端 | Linux 中国WGAN、CSGAN、ADC-GAN…你都掌握了吗?一文总结图像生成必备经典模型(二)7 Papers & Radios | 扩散模型只用文字PS照片;MIT泊松流生成模型击败扩散模型如何生成「好」的图?面向图生成的深度生成模型系统综述|TPAMI2022Stable Diffusion背后的故事:独辟蹊径,开源和社区驱动的AI独角兽 | 创始人专访文件更小,质量更高,大火的Stable Diffusion还能压缩图像?诺基亚勒令一个开源 Linux 手机项目 “NOTKIA” 改名字 | Linux 中国关于 Linux 和 Git 的创造者 Linus Torvalds 的 20 件趣事 | Linux 中国教授太太 2. 退学前考个博士资格【游纪】2022巴哈马—Great Stirrup CayLinux 优先的 AI 图像提升器 Upscayl 发布了第一个版本 | Linux 中国StableDiffusion嵌入现实世界,能在墙上直接长出小猫咪,手机可玩开源朗读者:使用 Linux 的优势和劣势 | Linux 中国首个中文Stable Diffusion模型背后的技术:IDEA研究院封神榜团队揭秘生成式 AI 火了,Stable Diffusion 幕后开发公司 Stability AI 宣布获得 1 亿美元融资3D版DALL-E来了!谷歌发布文本3D生成模型DreamFusion,重点是zero-shot
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。