Redian新闻
>
Stable Diffusion新玩法,一句话帮你换图,网友魔改《戴珍珠耳环的少女》长这样

Stable Diffusion新玩法,一句话帮你换图,网友魔改《戴珍珠耳环的少女》长这样

公众号新闻

机器之心报道

编辑:杜伟、陈萍

修改一张图,一句话的事就搞定。


输入一句话,就能把图片修改好,这是很多画师梦寐以求的修图工具!但是话说回来,再优秀的画师,如果仅凭自己的专业优势,不借助其他工具,也很难在短时间内完成图片的修改。


现在好了,AI 正在向图片生成领域发起挑战,各大科技公司、高校等开始纷纷涉足。最近一段时间,关心 AI 圈的人可能都有这样一种感受:扩散模型被越来越多的人提及,基于扩散模型的各种图片生成工具被开发出来。


在众多模型中,Stable Diffusion 可谓是最出圈的一个,为其捐赠计算资源的英国开源人工智能公司 Stability AI 为此还获得了 1.01 亿美元融资,融资完成后,Stability AI 估值将达到 10 亿美元。就在最近,还闹出了 Stable Diffusion 背后团队互撕的笑话,原因是他们都想当 Stable Diffusion 的所有者。


其实这个模型的技术来源是发表在 CVPR 2022 中的一篇论文《High-Resolution Image Synthesis with Latent Diffusion Models》,署名作者一共五位,分别来自慕尼黑大学、海德堡大学和 AI 视频剪辑技术创业公司 Runway。



研究者对 Stable Diffusion 的开发一直在继续。就在今日,reddit 上一则帖子点赞量已经突破 800+。



大概意思就是:Stable Diffusion 背后团队之一的 Runway 公司发布了一个由 Stable Diffusion 模型驱动的图像擦除和替换(Erase and Replace)工具,该工具可以修改图像任何部分。用户需要做的就是擦除该区域并编写自然语言描述,剩下的交给程序就可以了。


举例来说,一开始树叶上是一只七星瓢虫,用户擦出掉(如紫色区域)该动物,然后输入自然语言描述「正在找食物的蜜蜂」,点击「替换」按钮就可以了。



土地里「长」出不同的植物:



站在柱子上的不同种类的鸟:



不同样式的林中小屋:



宇航员替换成卫星:



看完上述展示,不禁有种修改一张图,就一句话的事的感觉。


此外,Runway 还发布了「擦除和替换」功能背后的模型,感兴趣的小伙伴可以在 GitHub 上查看。该公司计划在未来推出更多 Stable Diffusion 检查点,并在 Runway 的 HPC 集群上进行训练。



GitHub 地址:https://github.com/runwayml/stable-diffusion#inpainting-with-stable-diffusion


项目首先通过 Huggingface 的 Diffusers 库来使用修复模型。Diffusers 是在 PyTorch 中用于图像和音频生成的 SOTA 扩散模型,并作为扩散模型推理和训练的模块化工具箱。


相关代码如下所示。



同时,为了评估修复模型的性能,项目使用了与论文《High-Resolution Image Synthesis with Latent Diffusion Models》中相同的评估协议。由于 Stable Diffusion 修复模型接受文本输入,因而只使用一个固定提示,即「photograph of a beautiful empty scene, highest quality settings.」。


评估结果如下所示。



网友大开脑洞,生成创意图片


这个「擦除和替换」工具大大激发了网友的创作兴趣,各种猎奇的创意作品都整出来了,让人不得不佩服脑洞之大。


有人使用它恶搞了前几天宣布辞职的英国前首相莉兹 · 特拉斯。


Twitter@aifunhouse


还有人对荷兰画家约翰内斯 · 维米尔的油画《戴珍珠耳环的少女》进行了一系列「改写」,有趣极了。


Twitter@Yining Shi


感兴趣的读者也可以试玩下:https://app.runwayml.com/login


参考链接:

https://github.com/huggingface/diffusers

https://80.lv/articles/runway-released-a-stable-diffusion-powered-tool-to-replace-images/


声纹识别:从理论到编程实战

《声纹识别:从理论到编程实战》中文课上线,由谷歌声纹团队负责人王泉博士主讲。目前,课程答疑正在持续更新中。
课程视频内容共 12 小时,着重介绍基于深度学习的声纹识别系统,包括大量学术界与产业界的最新研究成果。
同时课程配有 32 次课后测验、10 次编程练习、10 次大作业,确保课程结束时可以亲自上手从零搭建一个完整的声纹识别系统。
点击阅读原文,了解更多课程内容。

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
上海中国画院首批画师介绍Stable Diffusion、DreamFusion、Make-A-Video、Imagen Video 和下一步见到同事不知道说啥?一句话帮你搞定,so easyStable Diffusion背后公司再融1亿美金,网友:资本的盛宴,艺术家却分不到一杯羹?AI绘画神器Stable Diffusion的疯狂与危险又有名画惨遭毒手……这次是《戴珍珠耳环的少女》戴耳环和不戴耳环的女生,差别到底有多大?!1.01亿美元融资,Stable Diffusion背后的公司两年迅速成长为AI内容生成独角兽生成式 AI 火了,Stable Diffusion 幕后开发公司 Stability AI 宣布获得 1 亿美元融资网友白嫖画师原作训练Stable Diffusion引正主不满:未经同意,说用就用?把Stable Diffusion模型塞进iPhone里,做成APP一分钟出图《部队大院的八零后》第五章 手榴弹要结婚了首个中文Stable Diffusion模型背后的技术:IDEA研究院封神榜团队揭秘文件更小,质量更高,大火的Stable Diffusion还能压缩图像?从历史上看中国工业化建设成形你对免治肉放心吗?特斯拉前AI主管出手,Stable Diffusion使用体验拉上一个台阶,还可白嫖算力青山处处埋忠骨 还是忠骨埋一处?1986年伦敦穷游记(4)Stable Diffusion背后的故事:独辟蹊径,开源和社区驱动的AI独角兽 | 创始人专访类数值方法PNDM:Stable Diffusion默认加速采样方案当下最强的 AI art 生成模型 Stable Diffusion 最全面介绍【环保】《戴珍珠耳环的少女》遭“袭击”!汽车展厅成新战场!输入文字生成音乐,这个音乐版Stable Diffusion火了,网友:电子音乐界要被冲击了 | 在线可玩「最牛AI艺术家」Stable Diffusion有多值钱?种子轮融资即晋升独角兽!Stable Diffusion入侵短视频,华人导演玩得太6,小扎都来请她世界名画变手办!戴耳环的珍珠少女撸橘猫、梵高抱着向日葵新晋独角兽陷纠纷!「AI艺术大师」stable diffusion到底归谁所有?袭击名画《戴珍珠耳环的少女》后,两位激进环保人士被判刑了……拒绝白嫖!Stable Diffusion新版:画师可自主选择作品是否加入训练集Stable Diffusion再迎重磅更新!2.0版「涩图」功能被砍,网友狂打差评Stable Diffusion团队开撕!“背后公司”刚成独角兽,最新版本遭原作者抢发:这是我们的图像生成模型 Stable Diffusion 现已开源 | Linux 中国首个中文Stable Diffusion模型开源,IDEA研究院封神榜团队开启中文AI艺术时代1.01亿美元融资,为Stable Diffusion捐赠算力的公司两年成为独角兽StableDiffusion嵌入现实世界,能在墙上直接长出小猫咪,手机可玩
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。