Redian新闻
>
ControlNet新玩法爆火!画出可扫码插画,内容链接任意指定!

ControlNet新玩法爆火!画出可扫码插画,内容链接任意指定!

公众号新闻

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【目标检测和Transformer】交流群

萧箫 发自 凹非寺
转载自:量子位(QbitAI)

一组神秘的“虚拟老婆”照片,最近在国内外社交媒体上传疯了。

怎么回事?

试着用手机扫一下,就能发现其中的玄机——

原来这些看起来颇为自然的照片,都是藏了二维码的图像。它们不仅能被手机相机识别,跳转的网站还都是有效的:

从推特到Reddit,每隔几条就能刷出这些二维码照片,下面全是一片“竟然扫出来了”的惊叹声。



最关键的是,这些照片并非手动绘制,而是用Stable Diffusion生成的,背后再一次加持了神奇的ControlNet魔法。

生成的二维码图像风格,也远非只有二次元虚拟人像这一种,一起来看看~

8种图像风格任意可选

除了上述的二次元插(lao)画(po)风格以外,作者们还展示了另外8种二维码图像的生成效果。

这是立体风格的二维码图像,看起来就像一张真正的城市照片一般:

有网友感叹,简直可以在物理世界中构造一个真的二维码城市了:

甚至它只能在特定的地点、特定的日子、特定的时间被扫出来,有寻宝游戏内味了。

这类立体作品不仅细节可控(如更多的草木植被),还可以改变风格,生成更具机械感的科幻二维码图像:

3D城市看得不过瘾,还有2D抽象风格的作品,数据都藏在小房子里了:

除此之外,二维码还能被融入中国传统纹样风格中,或是被巧妙放置在瓷器或壁画一类的装饰物里:

更具艺术性的水墨风格也能hold住,无缝衔接画作笔迹:

又或是这种水彩风格的画作:

日式的浮世绘风格也没问题:

还能嵌进PCB风格图像里,以后电路板要找售后,直接扫码就行(doge):

显然,除了二维码图像可控,模型就连插画风格都能很好地控制。

这背后究竟是依靠什么技术实现的?

LoRA和ControlNet齐出动

要想实现这种图像风格+二维码可控的效果,需要Stable Diffusion结合LoRAControlNet一起实现。

其中,LoRA负责控制整体的图像风格,ControlNet则负责确保二维码“放进”了图像中。

LoRA全称Low-Rank Adaptation of Large Language Models,能很好地实现少样本学习,从而对Stable Diffusion的图像风格生成进行更精准的控制。

换而言之,最少只需要几十张同种风格的图片,就能训练一个LoRA,用来调教Stable Diffusion生成的效果。

目前,比较有特色的如中国传统风格和浮世绘风格的图像,作者们都已经在CivitaiHugging Face等平台上开源了对应的LoRA模型。

像浮世绘风格LoRA模型,就已经可以在Civitai上直接下载:

训练这样一个浮世绘风格的LoRA模型,并不需要很多照片,像这个模型就只用了46幅葛饰北斋《富岳三十六景(追加十景)》的浮世绘。

风格变化更加多样的,如生成不同中国传统纹样的图片,也只需要近百张图片训练:

就可以得到能画出不同纹样的LoRA模型:

QR Code ControlNet则是作者们新训练的一个二维码图像生成专用ControlNet模型,目前还在不断优化中。

作者们尝试了不同的Stable Diffusion Checkpoint、LoRA和QR Code ControlNet的组合,生成了上面这些二维码图像的效果。

值得一提的是,结合最近的PS新出的Generative Fill功能,这些二维码还能被很好地嵌进一大块AI生成图像中:

有网友调侃,未来就连广告也会变得更好看了。

作者介绍

制作这个二维码生成项目的作者一共有四位,分别来自中国传媒大学和北京航空航天大学。

其中,倪豪陈柏宇是中国传媒大学大四本科生,王照涵是中国传媒大学一年级研究生,陈智勇是北京航空航天大学大四本科生。

在这次的AI二维码图像生成项目前,倪豪和陈智勇就已经做出过一个参数化二维码生成器,不过主要采用的还是图形学方面的技术。

据倪豪介绍,他们之前的研究方向主要集中在图形学和交互艺术上,随着这段时间AIGC爆火,团队也对这方面的技术产生了兴趣。

这段时间里,他们开发了不少不同风格的LoRA模型,以及可控制光影的ControNet等,目前模型也都已经放在Civitai上。

团队表示,目前这个二维码图像生成模型还在持续优化中,后续如果有更多的进展更新,也会同步到这个网站上。

可以码住期待一波了~

团队已开发的AI模型:
https://aigc.ioclab.com/index.html

参考链接:
[1]更多二维码效果展示:https://mp.weixin.qq.com/s/i4WR5ULH1ZZYl8Watf3EPw
[2]https://www.reddit.com/r/StableDiffusion/comments/141hg9x/controlnet_for_qr_code/
[3]https://twitter.com/dahbiahmed/status/1665778398084431872

点击进入—>【目标检测和Transformer】交流群


最新CVPR 2023论文和代码下载


后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF


目标检测和Transformer交流群成立


扫描下方二维码,或者添加微信:CVer333,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。


一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者ransformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群


▲扫码或加微信号: CVer333,进交流群


CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉,已汇集数千人!


扫码进星球


▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
photograph from the Belgian Congo in 1955推理效率比ControlNet高20+倍!谷歌发布MediaPipe Diffusion插件,「移动端」可用的图像生成控制模型【无忧买房】Brookline两室两卫公寓出售,82.9万美元,车库车位,优质学区,近Coolidge Corner和长木医学区iPhone 15售价超2万?灵动岛有了新玩法!历史小说《黄裳元吉》第七十七章 蜜意最航运 | DP DHL准备进行大规模收购,意指DB Schenker?Henan City Rolls Out Monthly Business Enforcement Amnesty春风忆金融巨头 | Jane Street Quantitative Trader开放招聘,起薪$300,000写周报、改代码,连续互动20轮,国产类ChatGPT新玩家「天工」来了(赠邀请码)萧萧千禧梦 第三章 寻呼标准 (10)CVPR 2023 | 小红书提出OvarNet模型:开集预测的新SOTA,“万物识别”有了新玩法AI爆火,年轻人有哪些新玩法?(文末有福利)欧洲皇室指定用伞制造商,德国百年品牌kobold精工晴雨伞,劳斯莱斯送的伞都是kobold制作的 ‼️课本旅行爆火!全网都稀罕的暑假玩法,去了百分百真香独家丨「Aventurier」获千万美元天使轮融资,商用清洁机器人涌现新玩法柏林工大也有自己的Döner店了!国际青少年创新创业大赛! International Youth Innovation&Entrepreneur ContestRolling Fund:微型基金的新玩法【意大利Hilnan&Bellne哈蒙·班尼】4个款式,满足各类穿搭需求随心切换!不锈钢方盆...优质好货开抢!【一日团】港大和微软提出Uni-ControlNet:可控制扩散模型再添一员!For This Rural County, Internet Fame Is About More Than MoneyBase薪资$250K!Jane Street (US) 开放2024 Winter Internship太震撼了!256张名家插画,40张历史图谱,讲透你从未见过的全新三国!Amid Uproar, Ctrip Pulls Plug on Women-Only Train CompartmentsTipping Livestreamers ‘Out of Control’: China State Broadcaster完美世界TA谈Stable Diffusion插件,ControlNet、Segment Anything精选Quant岗位 | SIG、Jane Street、Arrowstreet Capital l等公司持续热招!MDNet、SiamFC、ADNet、CFNet、LSTM(RNN)…你都掌握了吗?一文总结目标追踪必备经典模型(一)法国插画家,15年找遍全世界,画出一套“天地幽冥旅行图”致文学城民主革委会:关于杨柳历史问题的阶级立场这位脑洞大开插画师笔下的插画,太有创意了吧!PlayStation 5 digital with one controller 【无忧买房】Brookline联排别墅出售,2022年新建,优质学区,近Coolidge Corner和长木医学区导演消失了!Midjourney+妙鸭相机+Gen2新玩法:10块钱创造马斯克宇宙,一键图生视频
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。