Redian新闻
>
刚刚!ChatGPT绘图:新增一个令人惊喜的功能!

刚刚!ChatGPT绘图:新增一个令人惊喜的功能!

科技
你好,我是郭震
ChatGPT绘图刚刚增加一个新功能,支持在生成图中进行再编辑,这篇文章我来详细总结下这个功能。


1 初步使用
按照正常提问,绘制小猫和草坪。过一会,它会生成这样一幅图片:
接下来,点击这张图片,会弹出这个窗口,右上角有三个按钮,第一个按钮是select,也就是选择图片中的某个区域,支持选择区域的二次修改。
这个二次修改,我试了下,很强!
实际使用,比如,我选择如下左下角区域:

然后提示我,如何对这块区域进行编辑,比如我想在这块区域添加一个苹果:
我这样回复它,添加一个苹果,接下来GPT就开始计算
过一会,神奇的事情发生了,就在我选中区域,自动添加一只苹果:
咱们继续修改,再选中一个区域,添加一个水杯:
接下来,绘图完成后,选中区域并未绘制出水杯,第二次修改就会出现问题:
我尝试不选中区域,直接告诉它,添加水杯,然后得到下面这幅图:看到小猫和苹果的方位与上图已经发生变化。证明选择区域是必要的,否则会出现绘图扰动。
2 实现技术
我比较感兴趣的两个问题:
1) 多次选择区域,新增图像,为啥没生成
2)不选择区域,新图会与原图有较大变动。
我们先来看看,二次修图的技术原理
二次修复图像(如添加新的物品或特征到已有图像)涉及先进的图像生成和修复技术,其原理如下:
  1. 区域选择与标记:首先,工具会识别并标记图像中需要修改或添加元素的区域。这可以通过用户提供的提示或算法自动检测来实现。

  2. 掩码生成:通过生成掩码(mask),工具可以将要修改的部分与原始图像的其他部分分开,确保只对选定区域进行更改。

  3. 深度学习模型生成:使用预训练的生成模型,基于用户提供的描述和图像的上下文信息生成新的元素。模型会利用已经学到的视觉特征,在保持整体风格一致的前提下填充指定区域

  4. 融合与平滑处理:将生成的内容与原始图像进行融合,确保边缘过渡平滑,呈现自然一致的效果。模型通常会使用高级算法平滑边缘和调整颜色,以达到无缝的修复效果。

  5. 多次迭代优化:通过多次生成迭代,模型可以不断调整生成的结果,以达到用户预期的效果。这涉及反复运行模型,调整参数,直至生成理想的图像。


那么问题来了,我第二次选择区域,新增一个水杯,但是水杯没有出现在图中,可能的原因有哪些,我们分析一下:
  1. 域识别错误:模型没有正确识别你想要添加水杯的区域,导致模型没有在正确的位置生成水杯。

  2. 生成限制:生成模型可能存在限制,例如不能生成特定类型的物体,或者对复杂场景的处理能力有限

  3. 重叠问题:新生成的水杯可能被其他图像中的对象遮挡住,导致它在最终图像中不可见。


对于第二个问题,不选择区域,新图会与原图有较大变动。主要原因不选择区域时,模型不会被约束在特定的区域生成新的元素,它会重新生成整个图像。这通常会导致更大的变化。
上下文变化:如果模型没有明确的上下文指示,它可能会根据新的描述重新构建图像。因为没有选择固定区域,模型认为整个图像都可以改变。
以上。

发送 llm,免费获取《大模型从理论到实践》.PDF

2 我打造的Python人工智能全栈课(超700节视频课)已上线,长按二维码查看,咨询或报名请加我微信:gz113097485


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
微软发布新AI PC全家桶,支持GPT-4o/苹果发布更新修复照片复现问题/ChatGPT 语音酷似「寡姐」,本人回应美股基本面 - 2024_03_06 * 晨报 * ASML计划到境外扩张令荷兰政府担忧。CrowdStrike盘前大涨超243个令人兴奋的AI项目,已开源!OpenAI推迟发布ChatGPT语音模式,但MAC端桌面版ChatGPT上线了5、长篇家庭伦理小说《嫁接 下》第二章 无可奈何(1)OpenAI一夜干翻语音助手!GPT-4o模型强到恐怖,ChatGPT学会看屏幕,现实版Her来了GPT-4「荣升」AI顶会同行评审专家?斯坦福最新研究:ICLR/NeurIPS等竟有16.9%评审是ChatGPT生成ChatGPT 之父最新演讲:GPT-5 聪明程度超乎想象,一大批 AI 公司的努力将毫无意义今天起,这个重磅功能向 ChatGPT Plus 用户全面开放!GPT-4.5 疑似泄露, Altman 在线「吃瓜」令人惊讶!安省已成加拿大龙卷风之都!“风灾”趋势令人担忧!ChatGPT 之父最新演讲:GPT-5 聪明程度超乎想象,一大批 AI 初创公司的努力将变得毫无意义重大改革!安省宣布:新增高中毕业要求!学生需掌握实用生活技能!微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了刚刚!OpenAI放大招!不用注册,直接就可以使用ChatGPT了!(免费学提示词用法)4个令人兴奋的爆火AI项目,已开源!Apple WWDC24的18条总结:从GPT-4o开始集成ChatGPTTHE WHALE观后感4个令人惊艳的开源项目,诞生了!华人惊喜发现:一个无意之举竟给生活带来巨大改变,告别混乱生活!ChatGPT 大更新曝光!免费用户自动升级 GPT-4 ,还能创建 GPTs马伯庸新书,美食X权谋X悬疑,[hào]吃有多了不起?2024年超惊喜的回国就业机会等您来!可能是近期读过最惊喜的书BrainCo强脑科技 | 2024年超惊喜的回国就业机会等您来!8点1氪:周杰伦诉网易案一审败诉;蜜雪冰城称涨价1元尚未全国推广;许家印及中国恒大新增一则限制消费令退休的海龟该不该洄游?桌面版ChatGPT登台演讲,能视频通话还会实时读屏,GPT-4o最新demo再次惊艳:“能力还是被低估了”这是一个令人啼笑皆非又温暖感人的故事ChatGPT实体化了!手机变身ChatGPT实体机器人,只需一个配件,能说话还会做梦,真的牛!两重惊喜!奥特曼预告GPT-4和ChatGPT重大更新,Open AI要放大招【开箱】令人惊喜的新品,年度诚意之作,黄卡车来了出现了戒断反应。Lisa Su最新采访:这是一个令人兴奋的行业墨尔本电车将迎重大升级!包括这个人人都期待的功能!ChatGPT 之父最新专访:发现 GPT-4o 惊喜用途,下一代模型可能不是 GPT-5
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。