国际科技财经博客移民网络热点娱乐民生时事公众号

>

火了，又一款神器，开源了！

火了，又一款神器，开源了！

公众号新闻

2023-04-23 08:04

大家好，我是 Jack。

网上经常看到，请帮我 P 掉身边的 xxx 求助帖，拍照就会有 P 掉身边路人的需求。

今天介绍一个算法，不仅能够 P 掉指定的人或物，甚至能任意编辑。

配合着文字 prompt 输入，还能修改图片，比如：

输入 text prompt: "a camera lens in the hand"。

手中的甜甜圈就变成了相机镜头。

项目刚刚开源，感兴趣的小伙伴可以看看：

项目地址：https://github.com/geekyutao/inpaint-anything
论文链接：http://arxiv.org/abs/2304.06790

以下内容转自：机器之心

尽管当前图像修补系统取得了重大进展，但它们在选择掩码图和填补空洞方面仍然面临困难。基于 SAM，研究者首次尝试无需掩码（Mask-Free）图像修复，并构建了「点击再填充」（Clicking and Filling）的图像修补新范式，他们将其称为修补一切（Inpaint Anything）（IA）。IA 背后的核心思想是结合不同模型的优势，以建立一个功能强大且用户友好的图像修复系统。

IA 拥有三个主要功能：

移除一切（Remove Anything）：用户只需点击一下想要移除的物体，IA 将无痕地移除该物体，实现高效「魔法消除」；
填补一切（Fill Anything）：同时，用户还可以进一步通过文本提示（Text Prompt）告诉 IA 想要在物体内填充什么，IA 随即通过驱动已嵌入的 AIGC（AI-Generated Content）模型（如 Stable Diffusion）生成相应的内容填充物体，实现随心「内容创作」；
替换一切（Replace Anything）：用户也可以通过点击选择需要保留的物体对象，并用文本提示告诉 IA 想要把物体的背景替换成什么，即可将物体背景替换为指定内容，实现生动「环境转换」。

IA 的整体框架如下图所示：

移除一切

移除一切（Remove Anything）示意图

「移除一切」步骤如下：

第 1 步：用户点击想要移除的物体；
第 2 步：SAM 将该物体分割出来；
第 3 步：图像修补模型（LaMa）填补该物体。

填补一切

填补一切（Fill Anything）示意图，图中使用的文本提示：a teddy bear on a bench

「填补一切」步骤如下：

第 1 步：用户点击想要移除的物体；
第 2 步：SAM 将该物体分割出来；
第 3 步：用户通过文本示意想要填充的内容；
第 4 步：基于文本提示的图像修补模型（Stable Diffusion）根据用户提供的文本对物体进行填充。

替换一切

替换一切（Replace Anything）示意图，图中使用的文本提示：a man in office

「替换一切」步骤如上。

更多效果：

研究者建立这样一个有趣的项目，来展示充分利用现有大型人工智能模型所能获得的强大能力，并揭示「可组合人工智能」（Composable AI）的无限潜力。项目所提出的 Inpaint Anything (IA) 是一种多功能的图像修补系统，融合了物体移除、内容填补、场景替换等功能（更多的功能正在路上敬请期待）。

IA 结合了 SAM、图像修补模型（例如 LaMa）和 AIGC 模型（例如 Stable Diffusion）等视觉基础模型，实现了对用户操作友好的无掩码化图像修复，同时支持「点击删除，提示填充」的等「傻瓜式」人性化操作。此外，IA 还可以处理具有任意长宽比和 2K 高清分辨率的图像，且不受图像原始内容限制。

好了，今天就聊这么多吧，我是 Jack，我们下期见~

·················END·················

推荐阅读

• 炸裂，AI 打造了一个西部世界！• 为爱发电的博客园要没了？？！• MiniGPT4，开源了！

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

4个令人惊艳的ChatGPT项目，开源了！AIGC也太猛了...比Diffusion更快！OpenAI新图像生成模型开源了！清华校友宋飏一作 ChatGPT成功背后的秘密，开源了！刷榜GitHub！中科院学术科研专用版 ChatGPT开源了！斩获24K star。。论文润色、语法检查，一键搞定！ChatYuan又开源了！效果大幅升级，在手机上也可以跑复旦MOSS大模型开源了！Github和Hugging Face同时上线坐拥多个TOP级开源项目，不搞“竞争性开源”，蚂蚁在玩一种很新的开源时隔2年，我终于又发现一款神器，专门训练孩子的表达力！MiniGPT4，开源了！当老师最难的瞬间，因为这款神器，被彻底打破！CVPR 2023 | 开源了！一种通用的视频闪烁去除方法一个让ChatGPT读不懂的“马与爱”开源了！UniControl：可控视觉生成的统一扩散模型国产ChatGPT又开源了！效果大幅升级，在手机上也可以跑谷歌、OpenAI 都白干，开源才是终极赢家！谷歌内部文件泄露：欲借开源打败 OpenAI OpenAI又一新项目，火了！已开源！ChatGPT 开源了第一款插件，都来学习一下源码吧！坎坷的欧洲游(3)DataX: 阿里开源的又一款高效数据同步工具 GitHub开源神器，已获3k star！让你的 ChatGPT 不再报错！感受丝滑般体验！Stable Diffusion公司重磅开源大语言模型StableLM，又爆火了！屋顶太阳能光伏发电终于！中文基座模型CPM-Bee开源了又一个 SQL 神器，开源了！绝美挪威荷兰夏日之旅（十五）Stegastein观景-峡湾小镇Flam 开箱即用，5个令人惊艳的AI项目，开源了！160亿参数，新增多项能力，复旦MOSS开源了推特开源了，马斯克说到做到替你们试过了！传说中的露营三大神器，300出头太香了！号称史上最强、击败LLaMA的大模型开源了，却因为许可证被骂 GitHub 标星 21.2 K：高颜值 Markdown 编辑器开源了！谷歌没开源的PaLM，网友给开源了！千亿参数微缩版：最大只有10亿，8k上下文一个厉害的中医GPT，AI老中医开源了！他们开源了GitHub上最火的双语对话模型，还说AI胡说八道不需要被纠正晨跑

热点事件追踪