Redian新闻
>
「拖拽」就能实现精准P图的DragGAN,论文作者亲自揭秘技术了

「拖拽」就能实现精准P图的DragGAN,论文作者亲自揭秘技术了

公众号新闻


在图像生成领域,以 Stable Diffusion 为代表的扩散模型已然成为当前占据主导地位的范式。但扩散模型依赖迭代推理,虽然此方法可以实现具有简单目标的稳定训练,但推理过程需要高昂的计算成本。

在 Stable Diffusion 之前,生成对抗网络(GAN)是图像生成模型中常用的基础架构。相比于扩散模型,GAN 通过单个前向传递生成图像,因此本质上是更高效的。但由于训练过程的不稳定性,扩展 GAN 需要仔细调整网络架构和训练因素。因此,GAN 方法很难扩展到非常复杂的数据集上,这是 GAN 式微的原因之一。

当前,GAN 主要是通过手动注释训练数据或先验 3D 模型来保证其可控性,这通常缺乏灵活性、精确性和通用性。然而,一些研究者看重 GAN 在图像生成上的高效性,做出了许多改进 GAN 的尝试。

其中,来自马克斯普朗克计算机科学研究所、MIT CSAIL 和谷歌等机构的研究者们提出了一种强大的控制 GANs 的方式,即以用户交互的方式拖动图像的任何关键点以精确到达目标点。

为了实现这一点,该研究提出了 DragGAN,它包含两个主要组成部分:1)基于特征的运动监督,用于驱动关键点向目标位置移动;2)一种新的点追踪方法,利用 GAN 的特征来定位关键点的位置。

通过 DragGAN,任何人都可以精确控制像素的移动位置来变形图像,从而操控各种空间属性,如动物、汽车、人类、风景等的姿态、形状、表情和布局。由于这些操控在 GAN 的生成图像流形上进行,因此 DragGAN 可以生成被遮挡的内容和以及保证物体的形变符合物体的结构。定性和定量比较都表明,DragGAN 在图像操控和点追踪任务上优于先前的方法。此外,该研究还展示了通过 GAN 重建操控真实图像的例子。

为了让大家更好的了解这一研究,机器之心最新一期线上分享邀请到了 DragGAN 论文第一作者潘新钢,通过本次分享,大家可以更深入的了解这一项研究。

 
分享主题:Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold

嘉宾简介:潘新钢是南洋理工大学计算机科学与工程学院助理教授。此前他在马克斯普朗克计算机科学研究所从事博士后研究。他于清华大学获得学士学位,于香港中文大学 MMLAB 获得博士学位,师从汤晓鸥教授。他的主要研究方向是生成式 AI。
 
分享摘要:这次分享将主要介绍 DragGAN,一种新的图像编辑方法。通过 DragGAN,用户可以通过交互的方式拖动 GAN 所生成的图像的任何关键点以精确到达目标点,从而实现对各种空间属性如姿态、形状、表情和布局等的操控。
 
相关链接
 
  • 论文链接:https://arxiv.org/abs/2305.10973
  • 项目主页链接:https://vcai.mpi-inf.mpg.de/projects/DragGAN/

直播间关注机器之心机动组视频号,立即预约直播。


交流群:本次直播设有 QA 环节,欢迎加入本次直播交流群探讨交流。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
全网爆火的ChatGPT可代写论文,论文还要亲手写吗?斯坦福校长翻车,论文P图改数据,18岁学生打假把他拉下马...30%Token就能实现SOTA性能,华为诺亚轻量目标检测器Focus-DETR效率倍增准PR们必看 | 澳洲医保卡Medicare介绍+使用+申请全攻略,一卡在手可享11国医疗待遇女教授被开水烫伤《海兰湖之恋》&《小城夏天》【附PDF】整理了114篇医疗论文,含cvpr2023医疗论文+经典论文+医疗论文综述等无需点跟踪,克服DragGAN缺陷!中科大联合上海AI Lab发布FreeDrag:可稳定拖动语义内容火星乐园第三部《灰界》第五章 北岛堡垒你的DragGAN并不需要点跟踪!中科大和上海AI Lab提出FreeDrag:无需点跟踪即可稳定拖动语义内容找对资料,这门考试赢在起跑线!精准澳洲+精准院校+精准考季的资料在这里!离婚四年,宋仲基亲自揭开他与宋慧乔离婚的真正原因职场失意,我成了一名网文作者从流水线工人到网文作者,我和笔下的主角一起改写命运驯服调皮的Diffusion,就能让服装卖家们不再为请模特发愁了!GAN重出江湖!中国团队抢先开源“复刻版”DragGAN,AI一键实现“大象转身”飘梦秾华减少内存消耗、降低大模型训练成本,ACL杰出论文作者揭秘CAME优化器13层网络如何拿下83%精度?极简神经网络架构VanillaNet作者亲自解读DragGAN开源三天Star量23k,这又来一个DragDiffusion让GAN再次伟大!拽一拽关键点就能让狮子张嘴&大象转身,汤晓鸥弟子的DragGAN爆火,网友:R.I.P. Photoshop比亚迪王传福:「革命」就三五年的事,再累也要亲自指挥打仗|焦点分析无题DragGAN第一作者Xingang Pan,正式加入南洋理工,出任助理教授!CFA资料哪里找?精准澳洲+精准院校+精准考季!北大团队用Diffusion升级DragGAN,泛化更强生成质量更高,点一点「大山拔地而起」让GAN再次伟大!汤晓鸥弟子的DragGAN爆火台积电未来,靠这些技术了比我楼下超市还划算,几十块就能实现水果自由了?看了《长月烬明》,我更想精进画眼线的技术了NeRF基于线稿生成逼真三维人脸,细节风格随意改,论文已上SIGGRAPH国产手术机器人如何突围?上海交大郑国焱揭秘技术创新突破之道学会弹钢琴居然这么简单!成年人最想获得的技能之一,居然只需要23节课就能实现...ChatGPT攻破图灵测试,是时候找个新方法评估AI技术了三上悠亚亲自揭秘隐退内幕,并非「为爱息影」?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。