Redian新闻
>
一键换装,让奥特曼、黄仁勋穿上机器之心的文化衫

一键换装,让奥特曼、黄仁勋穿上机器之心的文化衫

公众号新闻
机器之心报道
编辑:陈萍、杜伟

赶紧来试试吧。


AI 帮你来试衣,想穿什么款式一键搞定。


精准捕捉服装细节,衣服纹理、图案、缝线等属性高度还原:


即使是在户外,AI 试衣也能准确展示试穿效果,保持较高质量的输出:


人物坐立姿势对衣物有遮挡,AI 也会毫无破绽的实现一键换衣,高度保持服装细节的一致性:


既然 demo 演示这么厉害,那试试让黄仁勋、奥特曼、霉霉等名人穿上机器之心的文化衫,出来的效果会怎么样呢?


换装 1:


换装 2:


换装 3:


试用地址:https://huggingface.co/spaces/yisol/IDM-VTON


试用了几轮下来,换装效果的确不错,但也有一些瑕疵,比如换装后有时会出现大花臂、衣服上的字体没有很好地还原、手部变形。


上面展示的虚拟试衣技术由韩国科学技术院 (KAIST) 、 OMNIOUS.AI 共同打造,他们提出了一种名为𝐈𝐃𝐌-𝐕𝐓𝐎𝐍的新型扩散模型,该技术在提高服装保真度的同时,还能生成真实的视觉效果。


  • 论文地址:https://arxiv.org/pdf/2403.05139.pdf

  • 论文主页:https://idm-vton.github.io/

  • 论文标题:Improving Diffusion Models for Authentic Virtual Try-on in the Wild


IDM-VTON 整体 pipelne 如下图左所示:IDM-VTON 包括(1)TryonNet 用于处理人物图像;(2)图像提示适配器(IP-Adapter)用于编码服装图像的高级语义;(3)GarmentNet 用于编码低级特征。


在 UNet 输入中,本文将人物图像潜在的噪声潜在与分割掩码、掩码图像和 DensePose 进行了拼接。本文还提供了服装的详细说明(例如,[V]:短袖圆领 t 恤),然后这些说明作为 GarmentNet 和 TryonNet 的输入提示。


注意力模块细节如下图右所示:TryonNet 和 GarmentNet 的中间特征被连接起来并传递到自注意力层,并使用输出的前半部分(即来自 TryonNet 的部分)。然后通过交叉注意力层将输出与来自文本编码器和 IP-Adapter 的特征融合。此外,本文还对 TryonNet 和 IP-Adapter 模块进行微调,同时冻结其他组件。


最后,我们再展示一下 IDM-VTON 的其他效果。


多人试穿同一件衣服:结果显示 IDM-VTON 可以生成高保真图像,识别服装细节。


IDM-VTON 和其他方法的比较结果可以看出,IDM-VTON 能够生成真实的图像并能够保留服装的细粒度细节。


了解更多内容,请参考原论文。





© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
【Poem Reading Tuesday】all the time I pray to Buddha by KobayashiAI之王黄仁勋黄仁勋刚刚发布,英伟达最强GPU B200,首次采用Chiplet?黄仁勋领导团队的秘密:直接管理50 人兵团,让层级愈少沟通愈好黄仁勋甩出最强AI核弹!GPU新架构性能暴涨30倍,首发人形机器人大模型,联手苹果闯MR今日arXiv最热大模型论文:复旦提出基于diffusion的虚拟试衣模型,模特一键换装黄仁勋问答全文:关于中国市场、全球供应链、奥特曼和Groq2024神奇魔幻哥伦比亚(二)波哥大:Monserrate Mountain越南旧政权的鈔票。 音樂:Romance De Lamour现场直击GTC|最科幻发布会,性能翻30倍的恐怖Blackwell芯片,黄仁勋宣告“新工业革命”来了黄仁勋最新研判:人形机器人未来或低至1万~2万美元,三大行业将迎来颠覆性变革 | 大模界黄仁勋身价倍涨,超越马斯克黄仁勋、英伟达、GTC、机器人,给我带来的几个震撼……黄仁勋最新对话:人形机器人将成为主流,售价会跟廉价汽车差不多GTC2024黄仁勋2万字演讲全文:不止计算革命和Blackwell,新软件、AI代工厂、AI机器人皆在路上!比甄嬛传还好看!黄仁宇、钱穆、黄永年都叹服:看过,毕生难忘!杨邦胜 、马丁·约克曼、谷腾 、孙华锋 、黄永才,KD511实燃!现场有没有你?谷歌工程师硬核长篇预测,证实黄仁勋观点:AGI或在2029年出现,AI五年内通过人类测试黄仁勋最新演讲:伟大都是熬过来的!中国人的文化常识课,文化自信从了解文化开始一键换装神器爆火,老黄换上抱抱脸T恤,CEO本人:我被替代了,和他争CEO职位争不过AI一键换脸,AKOOL推出火爆全网的虚拟人,年化营收达到千万美元宇宙人(1489期)聂海胜出席中国航天大会;文心一言数学能力与Claude-3并列第一;英伟达黄仁勋称人形机器人未来将成主流今早,黄仁勋宣布:最强AI芯片来了奥特曼称开发通用AI烧掉500亿美元也在所不惜;蔚来李斌赴美与黄仁勋探讨AI发展丨AIGC日报王传福:5 代 DM-i 续航 2000 公里;传腾讯急开发《幻兽帕鲁》类游戏;小扎、黄仁勋「友情换衣」,暗示合作|极客早知道《人生这壶酒》&《新化蝶》低调女老板;32岁母胎单身女6年相亲百人以上,从未恋爱过昨夜,AI芯片新皇登场!黄仁勋连发6枚核弹,还复活了机器人瓦力黄仁勋晒“AI核弹”,人型机器人模型也来了|首席资讯日报Meta 开放 MR 系统授权,联想华硕加盟;黄仁勋:别买车,买机器人!;12306:别信!任何「加速包」都没用| 极客早知道黄仁勋最新专访全文:点赞华为,回应是否担心中国与美国在AI领域竞争黄仁勋:生命科学才是未来北大团队推出Sora复现项目 ;OpenAI回应马斯克起诉;黄仁勋预测5年内AI通过人类测试丨AIGC大事日报AGI争论燃爆!奥特曼、马斯克、杨立坤、Hinton一众大佬关于“AGI何时降临?”的讨论
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。