Stable Diffusion 2.1版本发布，涩图功能回来了？

公众号新闻

2022-12-08 05:12

新智元报道

编辑：昕朋

【新智元导读】Stability AI发布Stable Diffusion2.1版本。三大更新内容中，大家更关心：之前的涩图生成功能回来了吗？

昨天，Stability AI带着最新款Stable Diffusion2.1版本来了！

这次发布，距离2.0大版本更新相距不到两周时间。一方面体现了公司效率之高；但另一方面，也暴露了前代模型存在的诸多不足。

本次更新，主要有三大亮点。

减少人像过滤：可以涩涩，但不完全能

在2.0版本中，为了防止色情内容和名人肖像的滥用，保护人类艺术家的权益，Stability AI使用了LAION的NSFW（不适宜办公场所观看）过滤器，过滤成人内容。

但是，许多用户反映，该过滤器过于保守，对于一些模棱两可的图像，只要机器认定是NSFW的内容，就会惨遭「和谐」。

这减少了模型训练数据集中的人物数量，导致用2.0创作的人像图片都显得异常诡异。

StabilityAI听取了用户的反馈，调整过滤器以减少限制。

在与LAION-5B的开发者合作分析了NSFW过滤器及其对训练数据的影响后，将设置调整得更加平衡。

调整后的版本在引入新的提示词的基础上，加入了许多之前版本的提示词，以便在2.0中过滤掉的绝大多数图像重新加入训练数据集，用以训练2.1版本。

但是官方也给各位老司机泼了盆冷水：2.1版本仍然会去除绝大多数成人内容。

毕竟，减少过滤限制是为了提升人像精度。

2.1版本在2.0的模型上进行微调，不仅可以轻松呈现美丽的建筑概念和自然风光，也可以生成人物和流行文化的梦幻形象。

SD2.1下的超级英雄

非标准分辨率图像渲染加强，轻松制作8K大片

该模型还能够渲染非标准分辨率的图像。这可以帮助用户完成各种创举，例如使用极致的纵横比，为用户提供美丽的远景和史诗般的宽屏图像。

2.0版本相较于1.0版本，最大的更新在于生成图像，尤其是建筑概念和自然风光图像的质量。

而2.1版本更是在建筑、室内设计、野生动物和景观场景方面的图像质量上，进行了又一次飞跃。

婆罗洲东马来西亚古代建筑遗址的超现实主义照片

日落时分阿尔卑斯山的山谷，史诗般的远景

古代东京/伦敦/巴黎建筑废墟的超现实主义照片，在被淹没的世界末日景观中陷落的摩天大楼

2.1版本之所以能轻松呈现美丽的建筑概念和自然风光，主要依靠其更长的训练时长。

与模型2.0相比，新版本在LAION数据集上多训练了接近20万个样本。训练数据的增加，大大提升了非标准分辨率图像的渲染能力。

加强反向提示词，图像更精致

反向提示词（negative prompt）与提示相反，它允许用户告诉模型不生成什么。

该版本加强了反向提示词的应用，用于消除不需要的细节，进行图像微调，例如手部损坏、手指过多或失焦和图像模糊。

提示：一个美丽的金发女人的肖像，美术摄影、柔和人像拍摄8K、长度中等、超逼真的超高清面部、Unsplash、柯达Ultra Max 800、85毫米胶片、复杂、休闲姿势、中心对称构图、令人惊叹的照片、杰作、颗粒状、居中构图；反向提示：裁剪、低分辨率、画得不好的脸、框架外、画得不好的手、模糊、糟糕的艺术、模糊、文本、水印、毁容、变形、闭眼

用户可以使用加权提示提示模型，对组合中的特定元素进行微调，例如某些颜色、对象或属性。

使用提示加权优化整体图像，以增加或减少合成元素，使用户能够更好地控制图像合成。