Redian新闻
>
人类对AI最大的误解,来自AI扩图

人类对AI最大的误解,来自AI扩图

公众号新闻

是时候展示真正的技术了。


-----------------------

编辑|Moon
来源|青投创新



这几天,在各大媒体榜单中,你一定看到过“AI扩图”的话题。


为什么会火?


可以说,AI扩图的火爆程度和搞笑程度不相上下。


先上一张传播度很高的AI扩图“佳作”:


这位博主凭借这一条视频单条视频点赞量171.7万,转发量213.2万,评论区有23.2万互动量。


许多网友纷纷效仿,在评论区留下自己通过AI扩图后的离谱照片,有些评论都能达到几万到几十万的点赞。


当然,明星和影视剧成了AI扩图搞笑创作的“重灾区”,有这样:



这样的:

还有这样的:

AI扩图仿佛打开了一扇新世界的大门,让普通人和AI也能轻松发生交集,只是可能会让人类产生“AI很弱”的错觉罢了。


其实,专业选手是十分惊艳的。


01

AI扩图的顶流们


AI扩图,就是基于AI算法的智能识别,它可以根据图像的上下文和纹理预测和生成图片缺失的部分,为原始图片带来更大的画幅和更广的视角。

其实AI扩图这个功能早在几个月就已经挺火了,最早是5月份Adobe Photoshop上线智能扩图功能,只需输入文字提示,AI即可扩图生成我们想象中的场景。

那个时候就已经有人用Photoshop生成恶搞影视剧照,表情包,可谓是小火了一把。

但,作为AI扩图圈的大哥大,Adobe Firefly可不是用来搞笑的。


它需要用户使用画笔进行添加或减去图片内容,进行局部重绘。随后,就可以输入新的描述词进行再创作。



10月左右,Adobe Firefly进行了一次重大更新,这次更新之后,Adobe直接将其命名为Firefly 2。

在Firefly 2功能下,无论是图片渲染程度、分辨率、还是图像模型等,均有了质的提升,特别是在渲染人体时,皮肤纹理、发丝等微小细节也均被照顾到。

从官方发布的图片来看,相较于Firefly 1,Firefly 2明显更为真实,细节之处也经得起推敲。
 


(图:Firefly 1&2对比)


值得一提的是,Adobe向Photoshop Beta用户免费开放公测的AI功能—Generative Expand,其核心功能就是扩展。


如果对生成的图片不满意,还可以通过修改描述进行无限生成,直到满意为止。

据悉,单次图片生成的时间约在1分钟左右,再加上图片生成后的精致效果,侧面展现了其强大的算力水平。
 


Adobe的成功,让其他AI巨头也蠢蠢欲动。

7月份MidJourney正式对外更新了“平移扩图”功能,可以实现图片进行前后“扩图 1.5 倍”或“扩图 2 倍”,相对之前固定式的生成式功能显得更加人性化。

说起MidJourney的扩图功能,简直想象力拉满。

我们先来看下这两个画面:

你能想象它们是出自同一张图片吗?

除此之外,还有更震撼的效果。

这就是Midjourney在它最新5.2版本中带来的Zoom Out功能。


效果一出,不少网友在惊叹“太疯狂”之余,也在猜测着它“扩”了多少次,有网友大胆地给出了预估:50次!!

更多网友则是纷纷自己开始搞花活,不到一个小时,直接出一部大片:


如此来看,MidJourney的扩图功能还是相当可以的。


此外,还有我们前几天介绍过的——Pika1.0。其可以完成视频的扩展。



不得不说专业选手果然是不一样的。

02

AI扩图另类出圈


但说实话,像MidJourney、Adobe Photoshop这种专业软件的扩图功能对于普通人来说,还是有一定门槛的,实用性并不高。

随后,为了满足普通用户的需求,国产AI绘画工具相仿上线AI扩图功能,比如美图、海艺AI、触手AI以及抖音等等。

拿抖音来说,AI扩图功能一上线,就因其用户体量大,使用门槛低,无需提示词,和平台流量扶持,迅速火爆出圈,基本达到全民皆可玩透的境界。

抖音热榜甚至达到几千万人在看的程度。

于是,才有了文章开头的局面,AI扩图正在成为全民娱乐的工具。

似乎……这个逻辑,确实不是人能想出来的!!

大哥应该很迷茫。

真的很想撬开AI的脑袋,看看它到底在想什么?!


不过,作为一款娱乐工具,可以给它们打个满分,毕竟它为很多博主带来了不少的粉丝和流量。


03

真正的AI扩图技术


针对AI扩图,其实不管是Midjourney、Photoshop、DALL-E 2还是Stable Diffusion,其背后原理也有些相似之处。


像DALL-E、Stable Diffusion、Photoshop的Generative Fill等都用到了一种叫做Outpainting的技术。


Outpainting是一种图像处理技术,与Inpainting(图像内部填充)相反,可以根据现有图像的内容、风格和上下文,合成与原始图像相协调的新内容,从而扩展图像的视觉范围。


Outpainting通常依赖于深度学习模型,有基于内容扩散的、基于GAN的、基于语义理解的等。


此外,AI扩图不仅是增加像素的数量,更重要的是增加图像分辨率的过程。


例如,CNN是AI扩图中常用的神经网络,通过学习大量的低分辨率和高分辨率图像对,来理解图像特征,学习如何从低分辨率重建高分辨率图像。


超分辨率技术使得模型能够填补低分辨率图像中缺失的像素,从而生成更高分辨率的图像。


在扩图过程中为了保证图像细节还要注意细节增强、噪声抑制等。


虽然目前AI扩图技术有了很大进展,但实时处理能力还有待提升,通常来说更高质量的图像扩展需要更多的计算时间。


现有的很多AI扩图工具生成速度已经有了不小的提高,不过成品的质量是否符合逻辑,这个概率还是比较随机的。



「往期推荐」

AIGC不会是下一个“元宇宙”?

告别元宇宙,Meta拥抱AI

星舰爆掉马斯克3000亿

是任正非怕了,还是余承东输了?



END

欢迎全国各地以及境外科技、消费、地产、医疗、农业、能源、环保、教育、文化、投行、基金、券商、信托、银行、保险、租赁、投资等产业及金融精英,寻找优质项目、资金及获得全球顶级金融圈层请联系Cathy,或者在菜单中点击【合作】——>【青投服务】,留下您的需求我们将竭诚为您服务。


青投创新,新型科创产业服务平台,以科技、人才、资本为核心,通过内容出版、数据支持、产业咨询、科技转化等业务,为科技人才创业项目提供孵化及加速赋能服务,助力国家科技兴国计划。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
马斯克最新专访实录:我最大的希望是“火星”,最大的恐惧是“人工智能”美国学者:我们对中国的误解太多了【热销】黄金奇异果,来自南半球的维C小金矿!家人照顾长者面临的误区看空军表演 - 简说高速摄影和F-22《天道》告诉你:人脉,是赚钱最大的误区笑不活了!老外对中国的误解到底有多深?营养丰富的“红宝石油”,来自南极洲的一种微小生物,被称作中老年的福音!高瑾|希腊女神与英国姑娘,思想的分歧促成朱光潜对罗斯金的误读吸取自然的纯净力量:普瑞堂【植物超临界低温萃取“OMEGA-3”】全球独一无二,来自深山纯天然 现在购买入码享受“免费”全球邮!Behind the Door春来了,你的感想是什么?像美林电风扇一样做轮动,是你对宏观对冲最大的误解!所有生命分子一夜皆可AI预测!AlphaFold 3改变人类对生命的理解,全球科学家都能免费使用雷军:创业找钱,容易陷入一个巨大的误区《天道》:人脉,是赚钱最大的误区黄仁勋每天都用的 AI 产品,来自 Google,颠覆 Google富不过三代?这是不折不扣的误解吉日成婚?亚当·斯密诞辰301周年 | 对亚当·斯密的三大误解,是经济危机的源头不完美哲学重磅官宣!中国对澳葡萄酒反倾销税,今日正式解除!澳中贸易再有重大突破!澳洲也将取消此类对华关税?江才健:天才的误议晚点独家|毫末智行获 3 亿元 B2 轮融资,来自九智资本和湖州长兴70B模型秒出1000token,代码重写超越GPT-4o,来自OpenAI投资的代码神器Cursor团队李放春:走近韦伯,细数对《新教伦理与资本主义精神》的误读|韦伯逝世104周年大神Karpathy强推,分词领域必读:自动钓鱼让大模型“发疯”的token,来自Transformer作者创业公司AI生图、扩图、去水印……全免费!「Sora 平替」Viva 玩了把大的对制片工作的最大误解竟然是?[电脑] 当下最值得入手的4K高刷显示器,来自电视厂商雷鸟的雷鸟U8电竞显示器在这充满焦虑的年代,“停下来”是最大的进步,“躺平”是最大的正能量!爆火!美图AI扩图和改图技术大揭秘我们最大的优势,也可能变成出海最大的劣势马斯克最新采访:我最大的恐惧是AI,最大的希望是火星亲眼目睹儿子变废,才顿悟:青春期叛逆,是父母对孩子最大的误解
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。