Redian新闻
>
火了,又一款神器,开源了!

火了,又一款神器,开源了!

公众号新闻

大家好,我是 Jack。

网上经常看到,请帮我 P 掉身边的 xxx 求助帖,拍照就会有 P 掉身边路人的需求。

今天介绍一个算法,不仅能够 P 掉指定的人或物,甚至能任意编辑。

配合着文字 prompt 输入,还能修改图片,比如:

输入 text prompt: "a camera lens in the hand"。

手中的甜甜圈就变成了相机镜头。

项目刚刚开源,感兴趣的小伙伴可以看看:

项目地址:https://github.com/geekyutao/inpaint-anything

论文链接:http://arxiv.org/abs/2304.06790

以下内容转自:机器之心

尽管当前图像修补系统取得了重大进展,但它们在选择掩码图和填补空洞方面仍然面临困难。基于 SAM,研究者首次尝试无需掩码(Mask-Free)图像修复,并构建了「点击再填充」(Clicking and Filling) 的图像修补新范式,他们将其称为修补一切 (Inpaint Anything)(IA)。IA 背后的核心思想是结合不同模型的优势,以建立一个功能强大且用户友好的图像修复系统。

IA 拥有三个主要功能:

  • 移除一切(Remove Anything):用户只需点击一下想要移除的物体,IA 将无痕地移除该物体,实现高效「魔法消除」;
  • 填补一切(Fill Anything):同时,用户还可以进一步通过文本提示(Text Prompt)告诉 IA 想要在物体内填充什么,IA 随即通过驱动已嵌入的 AIGC(AI-Generated Content)模型(如 Stable Diffusion)生成相应的内容填充物体,实现随心「内容创作」;
  • 替换一切(Replace Anything):用户也可以通过点击选择需要保留的物体对象,并用文本提示告诉 IA 想要把物体的背景替换成什么,即可将物体背景替换为指定内容,实现生动「环境转换」。

IA 的整体框架如下图所示:

移除一切

移除一切(Remove Anything)示意图

「移除一切」步骤如下:

  • 第 1 步:用户点击想要移除的物体;

  • 第 2 步:SAM 将该物体分割出来;

  • 第 3 步:图像修补模型(LaMa)填补该物体。

填补一切

填补一切(Fill Anything)示意图,图中使用的文本提示:a teddy bear on a bench

「填补一切」步骤如下:

  • 第 1 步:用户点击想要移除的物体;

  • 第 2 步:SAM 将该物体分割出来;

  • 第 3 步:用户通过文本示意想要填充的内容;

  • 第 4 步:基于文本提示的图像修补模型(Stable Diffusion)根据用户提供的文本对物体进行填充。

替换一切

替换一切(Replace Anything)示意图,图中使用的文本提示:a man in office

「替换一切」步骤如上。

更多效果:

研究者建立这样一个有趣的项目,来展示充分利用现有大型人工智能模型所能获得的强大能力,并揭示「可组合人工智能」(Composable AI)的无限潜力。项目所提出的 Inpaint Anything (IA) 是一种多功能的图像修补系统,融合了物体移除、内容填补、场景替换等功能(更多的功能正在路上敬请期待)。

IA 结合了 SAM、图像修补模型(例如 LaMa)和 AIGC 模型(例如 Stable Diffusion)等视觉基础模型,实现了对用户操作友好的无掩码化图像修复,同时支持「点击删除,提示填充」的等「傻瓜式」人性化操作。此外,IA 还可以处理具有任意长宽比和 2K 高清分辨率的图像,且不受图像原始内容限制。

好了,今天就聊这么多吧,我是 Jack,我们下期见~

·················END·················

推荐阅读

•   炸裂,AI 打造了一个西部世界!•   为爱发电的博客园要没了??!•   MiniGPT4,开源了!

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
一个厉害的中医GPT,AI老中医开源了!OpenAI又一新项目,火了!已开源!GitHub 标星 21.2 K:高颜值 Markdown 编辑器开源了!GitHub开源神器,已获3k star!让你的 ChatGPT 不再报错!感受丝滑般体验!ChatGPT 开源了第一款插件,都来学习一下源码吧!晨跑ChatYuan又开源了!效果大幅升级,在手机上也可以跑MiniGPT4,开源了!他们开源了GitHub上最火的双语对话模型,还说AI胡说八道不需要被纠正160亿参数,新增多项能力,复旦MOSS开源了当老师最难的瞬间,因为这款神器,被彻底打破!刷榜GitHub!中科院学术科研专用版 ChatGPT开源了!斩获24K star。。论文润色、语法检查,一键搞定!绝美挪威荷兰夏日之旅(十五)Stegastein观景-峡湾小镇Flam国产ChatGPT又开源了!效果大幅升级,在手机上也可以跑开源了!UniControl:可控视觉生成的统一扩散模型谷歌没开源的PaLM,网友给开源了!千亿参数微缩版:最大只有10亿,8k上下文终于 !中文基座模型CPM-Bee开源了4个令人惊艳的ChatGPT项目,开源了!AIGC也太猛了...坐拥多个TOP级开源项目,不搞“竞争性开源”,蚂蚁在玩一种很新的开源推特开源了,马斯克说到做到又一个 SQL 神器,开源了!谷歌、OpenAI 都白干,开源才是终极赢家!谷歌内部文件泄露:欲借开源打败 OpenAI号称史上最强、击败LLaMA的大模型开源了,却因为许可证被骂坎坷的欧洲游(3)一个让ChatGPT读不懂的“马与爱”Stable Diffusion公司重磅开源大语言模型StableLM,又爆火了!开箱即用,5个令人惊艳的AI项目,开源了!比Diffusion更快!OpenAI新图像生成模型开源了!清华校友宋飏一作复旦MOSS大模型开源了!Github和Hugging Face同时上线CVPR 2023 | 开源了!一种通用的视频闪烁去除方法屋顶太阳能光伏发电ChatGPT成功背后的秘密,开源了!替你们试过了!传说中的露营三大神器,300出头太香了!时隔2年,我终于又发现一款神器,专门训练孩子的表达力!DataX: 阿里开源的又一款高效数据同步工具
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。