Redian新闻
>
最强开源SDXL 1.0发布!质量拉满,超简单prompt一键生成

最强开源SDXL 1.0发布!质量拉满,超简单prompt一键生成

公众号新闻



  新智元报道  

编辑:拉燕 好困
【新智元导读】SDXL 1.0重磅发布!图片质量再创新高,prompt还变简单了。这不冲一波?

就在刚刚,Stability AI正式发布了下一代文生图模型——SDXL 1.0。

要知道,SDXL 0.9也就才发布一个月拐点弯。

而据官博介绍,这次的1.0版本是StabilityAI的旗舰版生图模型,也是最棒的开源生图模型。

杀手小猫

幽灵骑士

SDXL 1.0


别的不说,生图模型最重要的当然就是生图质量。

从官博中统计的数据可以看出,和其它模型相对比,用户更青睐1.0版本生成的图像。

该结果来自StabilityAI在Discord上进行的这几代Stable Diffusion模型的偏好测试。

可以看到,上图中纵轴是偏好比例,横轴则是各代SDXL或SD模型。一个月前的0.9版本偏好率是24.4%,低于1.0新版26.2%的偏好。

虽然差距没那么明显,但该说不说,新模型就得比老模型强。

StabilityAI表示,SDXL几乎可以生成任何艺术风格的高质量图像,是实现一顶一逼真效果的最佳模型。

它可以生成各具特色的图像,而不需要模型赋予任何特定的感觉,这样子才能确保风格的绝对自由。

参数方面,SDXL 1.0在色彩的鲜艳度和准确度方面做了很好的调整,对比度、光照和阴影都比SDXL 0.9更好,新版本生成的图片全部采用原生的1024x1024分辨率。

此外,SDXL 还能生成图像模型难以渲染的概念,如手和文字,还有各种物体的空间排列组合。

比如下面这四个图片。

同时,除了图片生成质量的上调,prompt的设定也变得更加方便。

现在,1.0版本的SDXL只需几个字的prompt就可以生成出复杂、细致、美观的图像。

以往,用户可能需要在prompt中加入「杰作」这类字眼,才能获得满意的高质量图像,现在不用了。

而且还有个小细节——prompt中细微的差别也能敏锐识别的。

比方说当「The Red Square」大写的时候,指的是景点「红场」,小写的「red square」,指的是红色的正方形。

现在SDXL都可以一步到位的领会意思了。

最大的开放式图像模型


从模型的参数规模上看,SDXL 1.0是目前开放式图像模型中参数数量最多的。

官方表示,这次采用的是全新的架构,基础模型的参数规模达到35亿,同时还有一个66亿参数大小的细化模型。

完整模型由一个用于潜在扩散的专家混合管道组成:

第一步,基础模型先生成(噪声)潜变量。

第二步,用专门用于最终去噪步骤的细化模型对其进行进一步处理。这里要注意的是,基础模型也可以作为独立模块使用。

这种两阶段的架构可确保图像生成的稳健性,而不会影响速度或者使用过多的计算资源。

SDXL 1.0可以在配备 8GB VRAM 的消费级GPU上运行,也可以在就绪的云上运行。

有了SDXL 1.0,根据自定义数据对模型进行微调比以往此前的版本都要容易。

自定义LoRA或是检查点的生成不需要太多的数据处理。Stability AI目前正在利用专门用于SDXL的T2I/ControlNet 来构建下一代的特定任务结构、样式和组成控制。

官方表示,这些功能目前处于测试预览阶段。

其实从6月份开始,Stability AI一直在预览SDXL 1.0的功能,还发布过一个仅用于研究的版本,目的就是展示该模型的全新功能。

官方表示,和之前的SDXL模型相比,SDXL 1.0的增强功能包括改进过后的图像提炼过程,可以生成更鲜艳的色彩、光照和对比度。

SDXL 1.0还引入了微调功能,使用户能够轻松创建高度定制的图像。

使用方法


而想要使用最新的SDXL 1.0也非常简单。

1. 在Clipdrop上体验SDXL 1.0。

别忘了,下面还有很多风格样式可选。

2. 在Stability AI的GitHub页面获取SDXL 1.0的权重和相关源代码。

3. 在Stability AI平台上通过API使用SDXL 1.0。

4. 在AWS Sagemaker和AWS Bedrock上获取SDXL 1.0。

5. 可以加入Stable Foundation Discord进行SDXL模型的实时测试。

6. DreamStudio也提供SDXL 1.0用于图像生成。

参考资料:
https://stability.ai/blog/stable-diffusion-sdxl-1-announcement




微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
电影预告一键生成,Midjourney+Gen-2生成视频刷屏了钮祜禄·Meta:发布最强开源新模型Llama 2,拉拢微软做盟友|最前线惊艳!AI写真一键生成多种风格照片,隐私问题引担忧……参数量仅为1/700,性能超越GPT-3.5!CMU+清华开源Prompt2Model框架今夏第一顶防晒帽选“升级版第三代”!帽檐加宽&防晒加码&舒适度拉满,49块拿下俩!AI又进化了,一键生成PPT太爽了!一段乱码,竟让ChatGPT越狱!乱序prompt让LLM火速生成勒索软件,Jim Fan惊了全球Top1咨询公司“御用”图表制作工具:3w一页报告,一键生成!2023回国---悲愤跳楼的地方+南京美食字节对话类AI产品内测;GPT-5或需5万张H100;智源最强开源语义向量模型上线丨AIGC大事日报日照分析一键生成?清华、GMP都用这个!(附神器下载)我为什么要活到老学到老?就不!文生图prompt不再又臭又长!LLM增强扩散模型,简单句就能生成高质量图像|ACM MM'23吓人,多伦多DT一个包裹寄丢1星期,里面有1000发子弹!还不是第1次一键生成NPC!燧原全栈MaaS平台首亮相,自研算力底座,重塑AIGC新生态微软也搞起了开源小模型!利用OpenAI的ChatGPT和GPT-4 训练,实力碾压当前最强开源模型组织结构图还在手动敲?用PPT一键生成啊!!不开玩笑,这个新出的AI神器,真能一键生成PPT!1800亿参数,性能碾压Llama 2,世界最强开源大模型Falcon 180B发布Runway最强竞争对手来了,一键生成短视频,限时免费开放使用Costco公寓和健康美食, 喜欢吗?空气质量拉响警报!华州山火季开启,西雅图西南部森林大火,紧急疏散...波士顿空气质量拉响警报!加拿大山火失控,浓烟下午抵达我通宵3天才用Enscape出完效果图,结果你直接一键生成,还堪比照片?(附参数下载)当AI开始一键生成PPT和Excel,我承认,我们真的慌了……顶级咨询公司“御用”PPT插件封神了!100+高级图表一键生成OpenAI祭出绘画神器,Midjourney一夜下台!DALL·E 3联手ChatGPT,无需prompt一笔成神AI赋能新媒体行业:可一键生成文章,135编辑器升级“智能创作“功能不会写文案?试试用AI一键生成!摩根大通发布2023年夏日阅读清单PDF,第一本沃顿学生都在读C919大型客机内部画面完整呈现 见证国产大飞机商业首航!我用Enscape调夜景灯光调到崩溃,你却告诉我可以一键生成!(附神器下载)文心一言APP国区可下载!免费体验120+玩法,PPT大纲Excel公式一键生成回国散记(1)- 中招之旅价值3000的效果图能一键生成,ENSCAPE要成为渲染界的天花板!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。