Redian新闻
>
35 亿+66 亿参数双模型,消费级显卡上也能跑!Stability AI 发布重大升级,生成图像真假难辨

35 亿+66 亿参数双模型,消费级显卡上也能跑!Stability AI 发布重大升级,生成图像真假难辨

公众号新闻
整理 | 核子可乐、冬梅
即使公众对创始人产生了诸多质疑,但不影响 Stability AI 在文本生成图像领域的持续推进。

日前,Stability AI 发布了 SDXL 0.9,这是其 Stable Diffusion 文本到图像模型的最新版本,代表 Stability AI 文本到图像模型套件迎来了新的发展里程碑。

继今年 4 月成功发布 Stable Diffusion XL beta 之后,SDXL 0.9 在图像和构图细节方面继续做出大幅突破。SDXL 0.9 是一款强大的工具,可用于在各种创意产业中创建高度逼真的图像。与之前的版本相比,此更新的模型对生成图像的质量和细节带来了重大改进。

SDXL 0.9 有哪些重大升级?

现在用户已可通过 ClipDrop 访问该模型,API 也将在不久后推出。研究人员正在努力完善 1.0 版本,相关成果包括权重设置预计将在七月中旬与大家见面。

SDXL 0.9 在继续保持通过现代消费级 GPU 运行的能力之外,在生成 AI 图像的创意用例方面也实现了飞跃。SDXL 能够为影视剧、音乐和教学视频生成超现实风格的创作结果,也具备在设计和工业用途中一展身手的水平。

示例:

在 SDXL beta(左)和 0.9 版本上以相同提示词进行测试,即可体现该模型在短短两个月内取得的重大进展。

提示词: ✨美学✨ 外星人拉在拉斯维加斯的人群中,粗砺的胶片摄影

(左图 - SDXL Beta, 右图 - SDXL 0.9)

提示词: 优胜美地国家公园的狼,冷冽的自然纪实胶片摄影

(左图 - SDXL Beta, 右图 - SDXL 0.9)

SDXL 系列还提供一系列超出基础文本提示的功能。其中包括图像到图像提示(输入一张图像,以获取该图像的更多变体)、填充(重建图像内的缺失部分)和外延(根据现有图像无缝向外扩展)。简单来说,它可以让用户更有创意,以更高级有趣的方式对图像进行更改。

SDXL 0.9 背后的力量

那么,SDXL 0.9 的底层技术到底是怎样的?

据 Stability AI 介绍,SDXL 0.9 之所以取得重大进展,核心驱动因素在于参数数量(模型训练时神经网络中所有权重和偏差的总和)较 Beta 版本有了显著增加。

SDXL 0.9 是目前所有开源图像模型中参数量最大的模型之一,基础模型拥有 35 亿参数,模型集成管线拥有 66 亿参数(最终输出由两套模型的运行聚合结果创建而成)。管线的第二阶段模型,专门用于向第一阶段模型生成的输出 添加更多精巧细节

相比之下,之前的 beta 版权拥有 31 亿参数并使用单一模型。

SDXL 0.9 运行在两个 CLIP 模型之上,其中包括迄今为止训练的最大 OpenCLIP 模型之一 OpenCLIP ViT-G/14。它增强了 SDXL 0.9 的处理能力,使其能够创建出更具深度和 1024 x 1024 更高分辨率的逼真图像。

SDXL 团队将很快发布一篇研究博客,详细介绍该模型的规格和测试情况。

尽管具有强大的输出和更先进的模型架构,但 SDXL 0.9 仍能够在现代消费级 GPU 上运行。具体配置要求为:

  • Windows 10 或 11/Linux 操作系统;

  • 16 GB 内存、英伟达 GeForce RTX 20 系列显卡(或更高版本)且至少配备 8 GB 显存;

  • Linux 用户也可以使用配备 16 GB 显存的 AMD 兼容显卡。

    测试版发布期间获得积极反响

Stability AI 因于 2022 年 8 月推出开源图像生成器 Stable Diffusion 而闻名,进一步加剧了其与 OpenAI 的 Dall-E 和 MidJourney 的竞争。

近日,Stability AI 刚被《时代》周刊评为 2023 年最具影响力的公司之一。其他出现在榜单上的人工智能公司还有 OpenAI(ChatGPT)、Hugging Face(协作开源人工智能平台)、Runway AI(生成视频)、Nvidia 和谷歌 DeepMind。

自 4 月 13 日 SDXL beta 版发布以来,Stability AI 在 Discord 社区上收到近 7000 名用户的热烈响应。用户们生成了超过 70 万张图像,平均每天超过 2 万张。超过 5.4 万张图像进入 Discord 社区的“Showdowns”评选,最终有 3521 张 SDXL 图像被评为优秀作品。

可用性和未来计划

SDXL 0.9 现已在 Clipdrop by Stability AI 平台上发布。Stability AI API 及 DreamStudio 客户端将于 6 月 26 日星期一开放该模型,同时提供 NightCafe 等其他领先的图像生成工具。

SDXL 0.9 目前暂时仅供研究学习目的使用,希望在全面发布前收集反馈并充分完善模型。相关代码后续将在 GitHub(https://github.com/Stability-AI/generative-models)上公开。

如果研究人员希望访问这些模型,请通过以下链接申请:

SDXL-0.9-Base 模型:https://huggingface.co/stabilityai/stable-diffusion-xl-base-0.9

SDXL-0.9-Refiner:https://huggingface.co/stabilityai/stable-diffusion-xl-refiner-0.9

Stability AI 一再强调,目前 SDXL 0.9 仅用于研究学习目的。

SDXL 1.0 计划在今年七月中旬(时间选定)全面发布。SDXL 0.9 遵循非商用、仅供研究的许可证发布,并受相关使用条款的约束。

参考链接:

https://stability.ai/blog/sdxl-09-stable-diffusion

 直播推荐

ChatGPT 的诞生打响了现代 AI 军备竞赛的第一枪。以 GPT-4、ChatGTP、Bard 等为代表的大语言模型在全球各界引起了广泛关注。结合 ChatGPT 的底层技术逻辑,未来中短期内 ChatGPT 产业化的方向大致有四类:即智能客服、文字模态的 AIGC 应用、代码开发相关工作以及图像生成。其中,最适合直接落地的项目就是智能客服类的工作。那么,想要将 LLM 大语言模型与智能客服产品进行结合,或者将前者落地于 ToB SaaS 应用软件领域,该如何着手搭建技术栈?AIGC 大模型在智能客服产品中该如何落地?

6 月 26 日 18:30~20:00,InfoQ《极客有约》邀请 bothub 创始人、布奇托网络科技创始人兼 CTO 徐文浩,京东云言犀 KA 产品负责人王超、中关村科金智能交互研发总监王素文、华院计算技术总监兼数字人事业部联合负责人贾皓文和大家聊聊 AIGC 将如何掀起智能客服新革命。



今日荐文


这将是一场灾难?37年历史的PostgreSQL数据库将进行重大架构变更


马斯克母亲叫停儿子与扎克伯格约架;消息称荷兰最早下周收紧ASML对华出口限制;14岁天才少年入职SpaceX | AI一周资讯


后 CentOS 时代,国产操作系统能否扛起大旗?


Meta首席AI科学家:AI还不如狗聪明,不会接管世界


LangChain:2023年最潮大语言模型应用开发框架


ChatGPT 再次成为焦点:学生放弃导师,改用 ChatGPT 自学!科技与狠活席卷高校?


eBay的平台自动升级解决方案



你也「在看」吗? 👇

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
2023回国——坐高铁的经历咏樱花果实CVPR'23 最佳论文候选 | 采样提速256倍!蒸馏扩散模型生成图像质量媲美教师模型真假难辨!$50假钞恐流入新州市场,已有商家“中招”,奔溃表示:防伪特征都复制了参数是 ChatGPT 的近 6 倍!英特尔公布 AI 大模型 Aurora genAI,具备 1 万亿参数30多年前无辜被老师鄙视的滋味至今难忘十亿参数,一键瘦身!「模型减重」神器让大模型狂掉3/4 | 最“in”大模型80%代码秒生成!AI神器Copilot大升级,百万开发者动嘴编码5年内成真微软Bing Chat全面开放,所有人可用!官宣多项重大升级,日活用户超过1亿爱奇艺VR公司业务停滞,员工或被欠薪;阿里云开源通义千问 70 亿参数模型,免费可商用;华为正式发布鸿蒙 4,接入大模型|Q资讯Snap团队最新AI研究成果:2秒文字成图,手机上也能运行GPT-4参数最新爆料!1.76万亿参数,8个2200亿MoE模型,PyTorch创始人深信不疑苹果秘密项目曝光:明年 iPhone 或迎大升级,大模型格局酝酿巨变苹果已研究生成式AI多年/阿里云开源通义千问70亿参数模型/新一代Switch最早本月宣布人手一个Midjourney!Stability AI开源旗下生图模型,做图圈炸了小米 AI 大模型首次曝光:64 亿参数;马斯克:敲定意大利「决斗」地点;美国防部成立生成式 AI 工作组 | 极客早知道安卓手机上跑15亿参数大模型,12秒不到就推理完了650亿参数,8块GPU就能全参数微调:邱锡鹏团队把大模型门槛打下来了生成式AI真假难辨,资本涌向打假科技我在iPhone上装了70亿参数大模型,来自陈天奇团队最新成果黑龙江上的飞龙鸟80% 代码秒生成!AI 神器 Copilot 大升级,百万开发者动嘴编码 5 年内成真郑州“学托”事件愈演愈烈:真假难辨、需求不减;有教育局工作人员此前要求屏蔽相关留言参数是ChaGPT的近6倍!英特尔公布AI大模型Aurora genAI,具备1万亿参数AIGC作品混入央美毕业展,真假难辨第四范式入局 AI 大模型!「式说 3.0」正式亮相,参数不固定,断网也能跑英特尔公布1万亿参数AI模型,比ChatGPT大570%Stable Diffusion 版本更新,生成图片更加真实Stability AI 发布开源版 DreamStudio,可使用最新 Stable Diffusion XL 图像生成器刘燕LaVIN-lite:单张消费级显卡微调多模态大模型港星罗嘉良肝癌晚期,几度昏迷不醒,命悬一线?真假难辨!这条路港中大和商汤提出HPS v2:为文本生成图像模型提供更可靠的评价指标与Midjourney开战!Stable Diffusion XL 0.9重磅发布,35亿+66亿双模型,AI图像生成飞跃式进步650亿参数,8块GPU就能全参数微调!邱锡鹏团队把大模型门槛打下来了!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。