Redian新闻
>
Stable Diffusion 2.1版本发布,涩图功能回来了?

Stable Diffusion 2.1版本发布,涩图功能回来了?

公众号新闻



  新智元报道  

编辑:昕朋
【新智元导读】Stability AI发布Stable Diffusion2.1版本。三大更新内容中,大家更关心:之前的涩图生成功能回来了吗?

昨天,Stability AI带着最新款Stable Diffusion2.1版本来了!

这次发布,距离2.0大版本更新相距不到两周时间。一方面体现了公司效率之高;但另一方面,也暴露了前代模型存在的诸多不足。

本次更新,主要有三大亮点。

减少人像过滤:可以涩涩,但不完全能


在2.0版本中,为了防止色情内容和名人肖像的滥用,保护人类艺术家的权益,Stability AI使用了LAION的NSFW(不适宜办公场所观看)过滤器,过滤成人内容。

但是,许多用户反映,该过滤器过于保守,对于一些模棱两可的图像,只要机器认定是NSFW的内容,就会惨遭「和谐」。

这减少了模型训练数据集中的人物数量,导致用2.0创作的人像图片都显得异常诡异。

StabilityAI听取了用户的反馈,调整过滤器以减少限制。

在与LAION-5B的开发者合作分析了NSFW过滤器及其对训练数据的影响后,将设置调整得更加平衡。

调整后的版本在引入新的提示词的基础上,加入了许多之前版本的提示词,以便在2.0中过滤掉的绝大多数图像重新加入训练数据集,用以训练2.1版本。

但是官方也给各位老司机泼了盆冷水:2.1版本仍然会去除绝大多数成人内容。

毕竟,减少过滤限制是为了提升人像精度。

2.1版本在2.0的模型上进行微调,不仅可以轻松呈现美丽的建筑概念和自然风光,也可以生成人物和流行文化的梦幻形象。

SD2.1下的超级英雄

非标准分辨率图像渲染加强,轻松制作8K大片

该模型还能够渲染非标准分辨率的图像。这可以帮助用户完成各种创举,例如使用极致的纵横比,为用户提供美丽的远景和史诗般的宽屏图像。

2.0版本相较于1.0版本,最大的更新在于生成图像,尤其是建筑概念和自然风光图像的质量。

而2.1版本更是在建筑、室内设计、野生动物和景观场景方面的图像质量上,进行了又一次飞跃。

婆罗洲东马来西亚古代建筑遗址的超现实主义照片

日落时分阿尔卑斯山的山谷,史诗般的远景

古代东京/伦敦/巴黎建筑废墟的超现实主义照片,在被淹没的世界末日景观中陷落的摩天大楼

2.1版本之所以能轻松呈现美丽的建筑概念和自然风光,主要依靠其更长的训练时长。

与模型2.0相比,新版本在LAION数据集上多训练了接近20万个样本。训练数据的增加,大大提升了非标准分辨率图像的渲染能力。

加强反向提示词,图像更精致

反向提示词(negative prompt)与提示相反,它允许用户告诉模型不生成什么。

该版本加强了反向提示词的应用,用于消除不需要的细节,进行图像微调,例如手部损坏、手指过多或失焦和图像模糊。

提示:一个美丽的金发女人的肖像,美术摄影、柔和人像拍摄8K、长度中等、超逼真的超高清面部、Unsplash、柯达Ultra Max 800、85毫米胶片、复杂、休闲姿势、中心对称构图、令人惊叹的照片、杰作、颗粒状、居中构图;反向提示:裁剪、低分辨率、画得不好的脸、框架外、画得不好的手、模糊、糟糕的艺术、模糊、文本、水印、毁容、变形、闭眼

用户可以使用加权提示提示模型,对组合中的特定元素进行微调,例如某些颜色、对象或属性。

使用提示加权优化整体图像,以增加或减少合成元素,使用户能够更好地控制图像合成。

根据没有反向提示词(左)和有反向提示词(右)生成图片的比较,可以发现后者在细节方面更加完美。

该图中,反向提示用于告诉模型限制树木、灌木丛、树叶和绿色植物的突出程度,同时保持相同的初始输入提示。

提示:宇航员在一个巨大的未来派金属机甲仓库内的超现实主义绘画,电影、科幻、镜头光晕、光线、史诗、哑光绘画、概念艺术、天体、软渲染、辛烷值渲染、artstation趋势,4k,8k;反向提示:裁剪、低分辨率、帧外、模糊、糟糕的艺术、模糊、文本、毁容、变形

虽然此次版本更新未能完全开放NSFW内容,但并不影响用户使用的热情。毕竟在AIGC领域,Stable Diffusion是当之无愧的顶流。

在人工智能民主化的时代,就像Stability AI说的那样:「开源即未来。」

参考资料:
https://stability.ai/blog/stablediffusion2-1-release7-dec-2022
https://www.reddit.com/r/MachineLearning/comments/zff0bh/p_stable_diffusion_21_release/

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
PS上的开源Stable Diffusion插件来了:一键AI脑补,即装即用佩飞机内幕. 台湾被卖? 中美缓和文件更小,质量更高,大火的Stable Diffusion还能压缩图像?把Stable Diffusion模型塞进iPhone里,做成APP一分钟出图Stable Diffusion、DreamFusion、Make-A-Video、Imagen Video 和下一步首个中文Stable Diffusion模型背后的技术:IDEA研究院封神榜团队揭秘Stable Diffusion入侵短视频,华人导演玩得太6,小扎都来请她告诉Stable Diffusion 2.0你不想要什么,生成效果更好:Negative Prompt显奇效Stable Diffusion新玩法,一句话帮你换图,网友魔改《戴珍珠耳环的少女》长这样Stable Diffusion再迎重磅更新!2.0版「涩图」功能被砍,网友狂打差评2022出圈的ML研究:爆火的Stable Diffusion、通才智能体Gato,LeCun转推开放麒麟 openKylin 0.9.5 版本发布,全面改进康复与理疗的区别1.01亿美元融资,为Stable Diffusion捐赠算力的公司两年成为独角兽Stable Diffusion背后的故事:独辟蹊径,开源和社区驱动的AI独角兽 | 创始人专访毛泽东工农红军的武器从哪里来「最牛AI艺术家」Stable Diffusion有多值钱?种子轮融资即晋升独角兽!吃肉的那点事儿类数值方法PNDM:Stable Diffusion默认加速采样方案英伟达超快StyleGAN回归,比Stable Diffusion快30多倍,网友:GAN好像只剩下快了AIGC落地门槛被打下来了:硬件预算一口气降至1/46,低成本上手Stable Diffusion2.0,一行代码自动并行首个中文Stable Diffusion模型开源,IDEA研究院封神榜团队开启中文AI艺术时代特斯拉前AI主管出手,Stable Diffusion使用体验拉上一个台阶,还可白嫖算力Stable Diffusion背后公司再融1亿美金,网友:资本的盛宴,艺术家却分不到一杯羹?1.01亿美元融资,Stable Diffusion背后的公司两年迅速成长为AI内容生成独角兽王羲之《游目帖》,放大Stable Diffusion团队开撕!“背后公司”刚成独角兽,最新版本遭原作者抢发:这是我们的One UI 5.0新测试版本发布,折叠屏率先开放测试网友白嫖画师原作训练Stable Diffusion引正主不满:未经同意,说用就用?Stable Diffusion采样速度翻倍!仅需10到25步的扩散模型采样算法生成式 AI 火了,Stable Diffusion 幕后开发公司 Stability AI 宣布获得 1 亿美元融资新晋独角兽陷纠纷!「AI艺术大师」stable diffusion到底归谁所有?NeurIPS 2022 | Stable Diffusion采样速度翻倍!清华提出扩散模型高效求解器StableDiffusion嵌入现实世界,能在墙上直接长出小猫咪,手机可玩Stable Diffusion的魅力:苹果亲自下场优化,iPad、Mac上快速出图
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。