Redian新闻
>
StableDiffusion嵌入现实世界,能在墙上直接长出小猫咪,手机可玩

StableDiffusion嵌入现实世界,能在墙上直接长出小猫咪,手机可玩

公众号新闻
衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

注意看,你面前是一堵平平无奇的墙。

现在,你可以按照自己的意愿,让它直接凭空长出点东西来。

比如……一只小猫咪?

没错,Stable Diffusion又可以搞新花活了!

这一次的重点在于,Stable Diffusion的触手扩展到现实世界——和WebAR相结合

作者是个软件工程师小哥Stijn Spanhove,经常在推特主页发些关于WebAR或XR的视频。

目前,这条凭空长猫的视频热度还挺不错。

新世界的大门打开,有网友对AR+SD的兴趣更浓了:

还有人说:

这简直就是《反恐精英》一个酷毙了的新版本啊!

一起来看看这个有点酷的新东西吧~

SD与AR一起玩

首先,拿起手机,然后随意选择一堵墙,透过屏幕界面锁定它:

选定一块心仪区域,把它圈起来,全部涂黑。

输入提示词:

一只可可爱爱的小猫咪,涂鸦风格,数字艺术

接着点击输入框下方的Diffusion按钮,直接快进到见证奇迹的时刻。

此时,无论从哪个角度看,墙上都有一幅《喵娜丽莎》在微笑地看着你了。

这个视频,是小哥利用火到没边、门槛又低的Stable Diffusion,结合WebAR,搞出的第一个实验产品。

他在评论区和围观网友讨论了具体的工作流程

第一步,冻结帧,把它作为生成图像的表面纹理,并让它拥有世界定位和设备跟踪相机。

第二步,向服务器发送API请求,并附上冻结帧(图像)和文本提示(Stable Diffusion)

整个工作中,将Stable Diffusion嵌入现实世界是利用AR完成的。

关于绘制纹理,小哥则使用了Raycast(一款完全可扩展的快捷启动器)

整个过程简单利落,引发了网友新的思考。

目前有很多有趣的NPU(嵌入式神经网络处理器)硬件,手机的共享内存也超过12GB。

在这个前提下,如果Stable Diffusion和AR一起玩这个工作能在本地运行,并且能够快到在类似的请求时间内,完成整个512x512图像生成,并在更快的AI上运行升级,一定非常有趣。

小哥自己也说,这个工作只是初尝试,一切只是Stable Diffusion和AR结合的开始

但大多数网友觉得这已经是个很有趣的工作了,甚至想在上面“乱涂乱画”好几个小时。

AIGC打破次元壁

Stable Diffusion的风吹进现实世界,绝不是小哥一个人的想法。

具体的操作流程,基本都是在原基础上用AR加持

就在这几天,另一位小哥用Stable Diffusion,搞了个视频透视式光学透视式眼镜。

(搁这儿叠buff呢?)

具体来说,就是小哥用Stable Diffusion做了个虚拟的AR眼镜,然后在手机屏幕上透过眼镜镜片,实现AR效果。

生成的虚拟AR眼睛不仅有电量提示,透过它看现实,能呈现西部世界、丛林、异形等多种画面风格

此外,还有人结合Meta旗下的AR创作工具Spark AR,利用Stable Diffusion,假装自己手握了一个方块小卡片。

就是上面还能播放动画的那种。

为了达到逼真效果,作者还在卡片表面叠了一个反光图层,让卡片呈现的光泽“像玻璃杯一样”。

不过,这次的Stable Diffusion产出的图像不是实时生成,而是事先录制的,因为当下的Spark AR版本还不支持AI和ML。

“Very Nice,通过Stable Diffusion,AI和AR再一次紧密相连了。”

不管怎么说,Stable Diffusion这么火,不仅靠的是跑出来的惊人结果,触及文本生成图像以外的领域时,实力也很强劲呀~

参考链接:
[1]
https://twitter.com/stspanho/status/1581707753747537920
[2]https://twitter.com/ThoseSixFaces/status/1581606079380672512
[3]https://twitter.com/sergeyglkn/status/1580167837770870784

「2022人工智能年度评选」火热报名中

现在,量子位「2022人工智能年度评选」已经正式启幕,评选将从企业、人物、产品/解决方案三大维度设置5类奖项。

更多关于评选标准、榜单报名欢迎扫描下方二维码~

点这里关注我 👇 记得标星噢 ~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~  



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
Stable Diffusion背后的故事:独辟蹊径,开源和社区驱动的AI独角兽 | 创始人专访网友白嫖画师原作训练Stable Diffusion引正主不满:未经同意,说用就用?当下最强的 AI art 生成模型 Stable Diffusion 最全面介绍图像生成模型 Stable Diffusion 现已开源 | Linux 中国一个电插座,收我九百刀生成式 AI 火了,Stable Diffusion 幕后开发公司 Stability AI 宣布获得 1 亿美元融资把Stable Diffusion模型塞进iPhone里,做成APP一分钟出图Stable Diffusion、DreamFusion、Make-A-Video、Imagen Video 和下一步3D暴龙模型塞进侏罗纪公园只需一部手机,拍摄角度360°可选,Stable Diffusion又被玩出新花样Stable Diffusion新玩法,一句话帮你换图,网友魔改《戴珍珠耳环的少女》长这样妈妈和保姆们(下)与老母亲的视频通话及感想Stable Diffusion入侵短视频,华人导演玩得太6,小扎都来请她「最牛AI艺术家」Stable Diffusion有多值钱?种子轮融资即晋升独角兽!Stable Diffusion背后公司再融1亿美金,网友:资本的盛宴,艺术家却分不到一杯羹?Stable Diffusion团队开撕!“背后公司”刚成独角兽,最新版本遭原作者抢发:这是我们的一日一诗:远方是一个寓言 / 被钉在墙上 | 鲁鸣:墙1.01亿美元融资,为Stable Diffusion捐赠算力的公司两年成为独角兽领只小猫咪,一直黏着你|萌宠寻人启事新晋独角兽陷纠纷!「AI艺术大师」stable diffusion到底归谁所有?文件更小,质量更高,大火的Stable Diffusion还能压缩图像?类数值方法PNDM:Stable Diffusion默认加速采样方案Stable Diffusion采样速度翻倍!仅需10到25步的扩散模型采样算法特斯拉前AI主管出手,Stable Diffusion使用体验拉上一个台阶,还可白嫖算力一日一诗:一个偷来的小时空 / 卡在墙上的玻璃 | 梦中望月:消失的色彩Tesla, 买还是不买?首个中文Stable Diffusion模型背后的技术:IDEA研究院封神榜团队揭秘可甜可咸的小猫咪,治好了我的精神内耗|萌宠寻人启事1.01亿美元融资,Stable Diffusion背后的公司两年迅速成长为AI内容生成独角兽香茅、柠檬草与柠檬香脂AI绘画神器Stable Diffusion的疯狂与危险首个中文Stable Diffusion模型开源,IDEA研究院封神榜团队开启中文AI艺术时代靠小猫咪维持精神状态,需要小猫!NeurIPS 2022 | Stable Diffusion采样速度翻倍!清华提出扩散模型高效求解器输入文字生成音乐,这个音乐版Stable Diffusion火了,网友:电子音乐界要被冲击了 | 在线可玩
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。