国际科技财经博客移民网络热点娱乐民生时事公众号

>

火爆全网！ControlNet颠覆AI绘画游戏规则！网友：这是新“魔法”...

火爆全网！ControlNet颠覆AI绘画游戏规则！网友：这是新“魔法”...

公众号新闻

2023-02-22 16:02

点击下方卡片，关注“CVer”公众号

AI/CV重磅干货，第一时间送达

点击进入—>【扩散模型】微信技术交流群

金磊发自凹非寺
转载自：量子位（QbitAI）

四位美少女，带着AI画画在ChatGPT的热浪中杀出了一片天地。

新“魔法”一出，瞬间吸引全场目光：

原本是一张四个闺蜜在沙滩边上的普通合影照：

在新魔法的加持下，“啪的一下”画风两极反转，瞬间进入唯美动漫风：

还有效果截然不同的，例如酱紫：

不仅是动漫画风效果上的惊艳，就连人物的pose也是保持得“原汁原味”，美女们这下子算是分分钟实现了动漫自由。

如此效果一出，也是引来了不少网友们的围观，直呼“在线求教程”：

也有不少人呼吁可以将这套玩法商业化了：

两大AI高手联动

使出这套AI组合拳的，是一位叫“viggo”的华人小哥博主。

他所持的两大法宝分别是：左手StableDiffusion，右手ControlNet。

StableDiffusion，相信很多友友们都已经很熟悉了，是根据输入提示的文本，就可以快速出图的AI作画神器。

ControlNet，则是新晋当红AI插件（GitHub上线2天狂揽4.6K星），相当于给AI作画这事加了buff，可以精准控制手部细节和整体结构等。

小哥的做法说起也是比较简单，就是先将原图导入进去，用StableDiffusion图片转文字。

再用Text2Prompt插件拓展找到对应的关键词；最后用ControlNet插件绑定骨骼开始换关键词试效果。

当然，原图中四位美女的姿势，也可以根据小哥绘制骨骼结构的不同发生相应的改变。例如这样的：

相比原图中人物的位置，上面这张中的人物更分散了一些，也站到了一排；以及上半身手臂的姿势也发生了变化。

也是得益于StableDiffusion的能力，AI生成画作在画风上也能产出截然不同的效果：

效果之惊艳，已经有网友按耐不住，照着小哥的说法“复现”了一遍，并表示：

第一次接触，很好玩，尝试复现下，感觉良好。

不过有一说一，这位新晋AI作画顶流插件ControlNet的“神通”可不仅于此。

简单几笔也可画出真人效果

例如微博博主“海辛Hyacinth”便分享了他用ControlNet插件后“草图变美女”的玩法。

他先是绘制了一张线稿：

然后是开启了ControlNet的scribble模细化效果，便得到了这样的结果：

效果之逼真，也是令人叹服了。

“海辛Hyacinth”还测试了在同一seed下不同参数的效果：

有小伙伴就要问了，那如果关闭了ControlNet，效果会如何？别急，博主也做了测试，效果是这样的：

“海辛Hyacinth”的这波操作也是得到了ControlNet作者的认可：

这也把博主本人激动坏了，直呼“尖叫”：

当然，ControlNet还可以实现其它诸多的功能，例如在装修设计上，可以输入一张拍好的卧室图，分分钟输出草图和换了风格的效果图：

以及在ControlNet的在线网站中，也提供了许多不同功能玩法体验，感兴趣的小伙伴可以去尝试哦：

给AI画画模型加buff

Adding Conditional Control to Text-to-Image Diffusion Models

代码：https://github.com/lllyasviel/ControlNet

论文：https://arxiv.org/abs/2302.05543

ControlNet的原理，本质上是给预训练扩散模型增加一个额外的输入，控制它生成的细节。

这里可以是各种类型的输入，作者给出来的有8种，包括草图、边缘图像、语义分割图像、人体关键点特征、霍夫变换检测直线、深度图、人体骨骼等。

那么，让大模型学会“按输入条件生成图片”的原理是什么呢？

ControlNet整体思路和架构分工如下：

具体来说，ControlNet先复制一遍扩散模型的权重，得到一个“可训练副本”（trainable copy）。

相比之下，原扩散模型经过几十亿张图片的预训练，因此参数是被“锁定”的。而这个“可训练副本”只需要在特定任务的小数据集上训练，就能学会条件控制。

据作者表示，即使数据量很少（不超过5万张图片），模型经过训练后条件控制生成的效果也很好。

“锁定模型”和“可训练副本”通过一个1×1的卷积层连接，名叫“0卷积层”。

0卷积层的权重和偏置初始化为0，这样在训练时速度会非常快，接近微调扩散模型的速度，甚至在个人设备上训练也可以。

例如一块英伟达RTX 3090TI，用20万张图像数据训练的话只需要不到一个星期：

作者基于当前大火的Stable Diffusion进行了具体实现，主要架构如下：

针对不同的输入，作者也给出了对应不同的模型，生成效果也都不错。

具体效果，就如我们刚才所展示的那样了。

One More Thing

最后来一个温馨提示……男同胞们不要觉得2月14日这个情人节过完就安全了。

接下来还可能有白色情人节（3月14日）、黑色情人节（4月14日）、玫瑰情人节（5月14日）、亲亲情人节（6月14日）……

赶紧把这套“AI组合拳”学起来，送自己的老婆/女朋友一张唯美的礼物吧！

参考链接：

[1] https://twitter.com/decohack/status/1627378506857611264
[2] https://weibo.com/timerainer1015
[3] https://github.com/lllyasviel/ControlNet
[4] https://twitter.com/lvminzhang/status/1627142848788463616

点击进入—>CV微信技术交流群

ControlNet 论文和代码下载

后台回复：ControlNet，即可下载上面论文和代码

扩散模型交流群成立

扫描下方二维码，或者添加微信：CVer222，即可添加CVer小助手微信，便可申请加入CVer-扩散模型微信交流群。另外其他垂直方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。

一定要备注：研究方向+地点+学校/公司+昵称（如扩散模型+上海+上交+卡卡），根据格式备注，可更快被通过且邀请进群

▲扫码或加微信号: CVer222，进交流群

CVer学术交流群（知识星球）来了！想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料，欢迎扫描下方二维码，加入CVer学术交流群，已汇集数千人！

▲扫码进群

▲点击上方卡片，关注CVer公众号

整理不易，请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

四少女火爆外网！ControlNet组合拳效果惊人，颠覆AI绘画游戏规则 NeurIPS 2022 | 重振PointNet++雄风！PointNeXt：改进模型训练和缩放策略审视PointNet++思想周报｜世界杯的最终赢家与生成式人工智能的“魔法”火爆全网！ChatGpt背后的男人，8岁会编程，24岁斯坦福辍学，60天破亿神迹……ControlNet star量破万！2023年，AI绘画杀疯了？"加特林"火爆全网！威力有多大？中国消防提醒火爆全网！加拿大夫妻住救护车，生活2年半0租金…周游各国，说走就走~适配Diffusers框架的全套教程来了！从T2I-Adapter到大热ControlNet 整理师“3秒整理法”火爆全网，网友们大受启发！“这简直太实用了！”ControlNet仅靠一张照片完成“旧房改造” | GitHub热榜第一新年第一坑！火爆全网的“围炉煮茶”究竟是不是“照骗”？网友：完全是智商税！球迷献给梅西的作品，让人感动到哭 AI画图又双叒革命了？华人小伙开发ControlNet让出图更可控！吵翻了！CNY还是LNY？大批留学生刷屏，澳洲中国银行称春节为LNY！澳洲CNY趋势第一，越南人表示不乐意了，澳韩国烤肉“作妖”“饶舌”不分年龄！法国养老院老人说唱歌曲视频火爆全网！引爆全网！ChatGPT让家长学校都陷入恐慌！未来10年还剩多少工作给这一代孩子？AACO College Panel: From High School to College AI降维打击人类画家，文生图引入ControlNet，深度、边缘信息全能复用龙卷风健康快递 229 ChatGPT火爆全网！赴美留学还有哪些必备实用网站？ChatGPT颠覆传统搜索引擎，它的回答能信几分？美女律师因穿粉色被开除，复仇前老板火爆全网！现实“律政俏佳人”都是爽文女主～引爆全网！ChatGPT让家长和学校都陷入恐慌！未来10年还剩多少工作给这一代孩子？服务网格 2022 ：Gateway API 是最大惊喜，eBPF 不会改变游戏规则 ControlNet如何为扩散模型添加额外模态的引导信息？每周健走 - 4月16日: 红河谷国家城市公园（3）改变游戏规则！皇后区出现人工智能停车库全自动安全泊车 ChatGPT能自己跑代码了：提需求直接输入运行结果，网友内测后直呼“魔法”7 Papers & Radios | 一块GPU跑ChatGPT体量模型；AI绘图又一神器ControlNet 43岁清美学霸火爆全网！8块腹肌，财富自由，把家设计成博物馆！究竟什么来头？网友：偶像剧都不敢这么写！巨树“猎人”，“魔法”森林平安夜晚餐金融游牧信仰的颠覆（七十）

热点事件追踪