Redian新闻
>
一键换装神器爆火,老黄换上抱抱脸T恤,CEO本人:我被替代了,和他争CEO职位争不过

一键换装神器爆火,老黄换上抱抱脸T恤,CEO本人:我被替代了,和他争CEO职位争不过

公众号新闻
西风 发自 凹非寺
量子位 | 公众号 QbitAI

笑不活,最新虚拟试穿神器被网友们玩坏了。

黄院士、马斯克、奥特曼、史密斯等一众大佬衣服集体被扒。

前有老黄卸下皮衣套上糖果包装袋:

后有奥特曼大秀花臂穿CUCCI:

再有老马变成了蛛蛛侠:

好莱坞巨星史密斯也风格大变:

但说回研究本身,确实正儿八经的研究。

名为IDM–VTON,由来自韩国科学技术院和OMNIOUS.AI公司的研究团队基于扩散模型打造。

目前官方放出了demo,大伙儿可以试玩,推理代码已开源。

除了开头所展示的,抱抱脸研究员也玩的不亦乐乎,给老黄换上了专属战袍。其CEO连忙转发打趣:

我被替代了,没法和他争CEO。

看热闹的网友也是感慨,经过这么多年,终于不用再担心自己“手残”了(AI帮你搞定)

来玩啊~

我们也赶紧上手体验了一把。demo整个页面是这样婶儿的:

操作起来也是非常简单。

首先上传人物图,可以手动或者自动选择要修改的区域。然后,上传要换的衣服。

直接点击Try-on,会自动生成掩模图和换装后的图:

上面这张自动生成的掩模把手也选进去了,所以最后生成的左手效果不好。

我们手动选取涂抹一下,同时人和衣服全部都用我们自己的图。


这次效果大伙儿觉得如何?

再来展示一波网友的试玩成品图。

DeepMind联合创始人苏莱曼穿上了微笑面具修格斯联名款T恤:

甚至不少网友真想要这件衣服。

奥特曼再次被网友当成模特:

当然也有翻车的时候,比如马斯克穿的就是山寨CUCCI。

看完效果后,接着来看IDM–VTON在技术上是如何实现的。

基于扩散模型

技术方面,IDM–VTON基于扩散模型,通过设计精细的注意力模块来提高服装图像的一致性,并生成真实的虚拟试穿图像。

模型架构大概包含三部分:

  • TryonNet:主UNet,处理人物图像。

  • IP-Adapter:图像提示适配器,编码服装图像的高级语义。

  • GarmentNet:并行UNet,提取服装的低级特征。

在为UNet提供输入时,研究人员将人物图片的含噪声潜在特征、分割掩模、带掩蔽的图片和Densepose数据整合在一起。

他们还会为服装添加详细描述,例如[V]表示“短袖圆领T恤”。这个描述随后用作GarmentNet(例如,“一张[V]的照片”)和TryonNet(例如,“模特正在穿[V]”)的输入提示。

TryonNet和GarmentNet产生的中间特征进行了合并,随后传递至自我注意力层。研究人员只使用了来自TryonNet的输出的前半部分。这些输出与文本编码器和IP-Adapter的特征一起,通过交叉注意力层进行融合。

最终,研究人员对TryonNet和IP-Adapter模块进行了精细调整,并锁定了模型的其它部分。

实验阶段,他们使用VITON-HD数据集训练模型,并在VITON-HD、DressCode和内部收集的In-the-Wild数据集上进行评估。

IDM–VTON在定性和定量上都优于先前的方法。






IDM-VTON可以生成真实的图像并保留服装的细粒度细节。

更多细节,感兴趣的家人们可以查看原论文。

项目链接:
[1]https://idm-vton.github.io/?continueFlag=589fb545dbbb123446456b65a635d849

[2]https://arxiv.org/abs/2403.05139
[3]https://huggingface.co/spaces/yisol/IDM-VTON?continueFlag=589fb545dbbb123446456b65a635d849
参考链接:
[1]https://twitter.com/multimodalart/status/1782508538213933192

[2]https://twitter.com/fffiloni/status/1783158082849108434
[3]https://twitter.com/ClementDelangue/status/1783179067803533577

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
人类无法被替代:探索《沙丘2》反抗AI奴役的秘密明星都在穿的百年潮牌T恤,百元就买到了!百搭有型不过时AI一键换脸,AKOOL推出火爆全网的虚拟人,年化营收达到千万美元不冷不热的时候怎么穿!早春必备的百搭长袖T恤,柔软舒适不拘束,比捡漏价还要划算一夜暴富50亿,老黄新晋「流量明星」!英伟达市值破3万亿,超越苹果成全球第二今日arXiv最热大模型论文:复旦提出基于diffusion的虚拟试衣模型,模特一键换装这款69.9元2件的空调凉感T恤,丝滑不沾身,狠甩普通T恤几条街!97、长篇家庭伦理小说《嫁接》第二十六章 暴风骤雨(3)快扔掉你的棉T恤吧,夏天穿“它”凉感黑科技T恤,排汗吸湿,透气清爽不闷热......硬核清仓!白菜价,“棉中丝绸”丝光棉T恤,到手不过20元!马斯克擎天柱大将跳槽,在抱抱脸🤗开源一套机器人技术:会做家务的大白,复刻低至1800又到一年毕业季狗引儿【长篇】(十三)一键换装,让奥特曼、黄仁勋穿上机器之心的文化衫凯特持续消失,终被替代!英王室化身恶魔,照片公布,终于不藏了该买T恤了!99元3件~薅大牌代工厂100%纯棉印花T恤,超有质感,百搭不挑人!颠覆性GTC,老黄再扔炸弹 |【经纬低调出品】【荐】人工智能时代,AI已经替代了大多数工作,孩子未来怎么办?年轻英俊,就这么死了?现实堪比惊悚大片美股基本面 - 2024_02_26 * 晚报 * 收盘:美股小幅收跌 市场关注通胀数据与联储政策。周一热门中概股多数上涨,理陈道明:人到中年,本事再大,你都争不过天道(读完醍醐灌顶)英伟达卷疯了!最强芯片炸裂AI界,老黄还拿出机器人大模型英伟达又赚麻了!一季度净赚千亿,老黄一开口股价就起飞,财报会信息量巨大风靡85年户外大牌T恤,独一份的设计感,139元/2件中山大学和字节发布「视频虚拟试穿」扩散模型VITON-DiT,一键生成换装后视频!没穿过匹马棉T恤,就不叫过夏天!男子高铁上抱着女儿进厕所,半小时不出来,乘务员破门后怒了:畜牲!该买T恤了!79元3件~薅大牌代工厂100%棉情侣款印花T恤,超有质感,百搭不挑人!深夜炸场!英伟达发布全球最强 AI 芯片,性能暴涨 30 倍,老黄才是这个时代的乔布斯该穿T恤了!这款绝美T恤,显瘦气质炸了!一个顶五个H100的B200,老黄这是打破摩尔定律了?苹果 iOS 18 上手体验:一键换图标主题,iPhone 通话录音终于要来了这才是真的“遥遥领先”!地球另一边,老黄半夜捅破天!像造iPhone一样造芯片,老黄打破摩尔定律、解决耗电难题?8年后再次见证历史!世界首台DGX H200,老黄亲自交付给奥特曼
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。