Redian新闻
>
新版Midjourney太炸裂:AI绘画再无Bug,“有图有真相”时代彻底过去

新版Midjourney太炸裂:AI绘画再无Bug,“有图有真相”时代彻底过去

科技
本地视角记录硅谷,全球视野关注创新
别忘了给我们加星标~


2023



新技术追踪


BUSINESS








进化版的AI绘图工具创造出了一个平行世界。


文| Juny  编辑| VickyXiao



过去几个月,以ChatGPT为首的聊天机器人搅得科技界满城风雨,大家都忙着去跟各家的AI聊天,让它们来写邮件、写代码、写诗。而当语言模型在大跨步向前进化时候,AIGC的另一个重要分支——绘图,最近其实也完全没闲着。

去年曾因拿下艺术比赛大奖而名噪一时的Midjourney,近期在AI生成图片领域热度可以说堪比OpenAI。MidjourneyV4版本去年年底几乎跟ChatGPT同期上线,而就在上周GPT-4推出的时候,Midjourney也飞速推出了第五代版本,而这一次的更新堪称“炸裂”。

一周以来,各种用Midjourney生成的神图层出不穷,国足夺冠、特朗普插秧、教皇打碟、异形下乡……只要你敢想AI就敢画,而且随便拿出一张都能做到以假乱真的程度。但可能有创作的伪照片过于真实,引起了太多争议,太多新用户涌入导致服务器不堪重负,本周二,Midjourney宣布关闭了其免费账户的使用通道。

不过,另外一方面,在人们疯狂娱乐的同时,一些人也尝试着把ChatGPT和Midjourney结合起来使用,一些由人类构思、AI主导和操作的“人机合作”作品也逐渐显现出了商业化应用的轮廓。

|当图片向照片进化:一个由AI创造的平行世界诞生

你有没有想象过这样的画面:

在不久前落幕的卡塔尔世界杯上,整个绿茵球场变成了一片红色的海洋。大家欢呼雀跃,全场掌声雷动。

图片来自小红书博主,账号:Ai船长

爱因斯坦没有出现在实验室里,而是梳着标志性的发型,在音乐节上狂欢

图片来自推特

马斯克没有在21世纪造火箭和电动汽车,而是穿越到了苏联工厂,真正当起了一名“钢铁侠”(工人)。

图片来自推特

这样的世界,你觉得怎么样?

以上这些无比真实的照片,并不是由谁花了大量时间PS制作的,而是很多普通人通过动一动手指头,打几个关键字,就让人工智能在十几秒内所自动生成的。

造就这以假乱真世界的幕后推手是一个名为Midjourney的AI生成图片工具。可以说, 目前在AIGC绘图领域,MidJourney是一个比OpenAI还神奇的存在。Midjourney没有任何巨头的重金支持,是一个自筹资金的独立研究实验室,它的发起人为曾两次拒绝苹果收购的Leap Motion公司的创始人David Holz,目前全职员工仅有11人。

但就是这么一个超小型团队,却是当前AI绘图领域最炙手可热的明星,甚至将OpenAI的DALL-E、Stable Diffusion、英伟达的GauGAN2等同类工具都甩在了身后。

|比肩GPT的更新速度,惊叹和争议相继到来

Midjourney的迭代速度相较于OpenAI可以说是有过之而无不及。去年3月份第一版本首次上线,4月份便火速更新第二版本,接着7月份上线Open Beta V3版本首次向公众开放,之后以其独特的艺术性风格吸引了一些用户。其中,最出圈的就是这张由普通人给出提示词、AI负责创作,跟人类艺术家同台比赛之后斩获金奖的油画。

之后Midjourney并没有停下更新的脚步,11月又推出第四代版本添加了更多图片风格,紧接着今年3月份,Midjourney V5版本登场。此次V5版本的更新之所以能引发大量关注,主要是因为它解决了一个技术难题和完成了一次跨越性的突破。

其中,技术难题指的是——画手。

让AI画出逼真的人类手部特征是一个看起来简单但却出奇复杂的任务。首先,在 AI的训练图集中,手往往都不是图片的重点,同时人们握手、牵手、鼓掌等不同状态下手部形态各异,很难形成标准化的模版,这也就造成了AI学习难度的激增。

此外,即便对于传统人类画师来说,画手也是最困难的地方之一。手的几何形状复杂,并没有一套标准的线条或形状,指关节上的皱纹和褶皱、手掌上的阴影等细节非常多,并且每个人的手都不一样,是独一无二的存在,并不能套用。

因此正确并精细化地画手对于所有的AI工具来说都是一项困难的挑战,在Midjourney的V5之前,行业内的AI绘画工具都无法很好地完成。

Midjourney(左)、Stable Diffusion(右上)和DALL-E 2(右下)此前生成的奇怪人手,图片来自buzzfeednews

但现在,Midjourney V5版本的已经完美解决了这个问题。

图片来自推特

不仅告别了六指或畸形,还能结合人物特点画出不同状态和年龄画出不同的手部细节,就连在光影中的手指纹路也能被完美呈现。

图片来自于mpost

而除了攻克了画手这个技术难题之外,Midjourney V5此次另一跨越性的突破在于——能够生成照片级的图片,并且还是摄影大师拍的那种。

在V5之前,Midjourney生成的图片总体以卡通或超现实风格为主,但V5版本能够支援包括真实、抽象、油画等更广泛的风格,图像解像度比上个版本提高2 倍。而此次写实风格的上线,可以说直接到了让很多摄影师都要感叹“摄影学不存在了”的地步。

比如,以“90年代大街上的模特”为主题,完美创造出真假难辨的照片。

图片来自推特,账号Nick St. Pierre

以“你好小朋友”为主题,用胶片质感完成童年重现。

图片来自小红书博主,账号:逗比

以“发生飓风的新闻报道”为主题,无中生有地去还原一个灾难现场等等。

图片来自推特

从以上这些照片示例中可以看出,Midjourney的写实图片生成并不局限于一种固定的风格,而是会根据你描述场景和想要的风格来智能化的调整色调、像素、镜头语言等。最近Midjourney产出的很多图片,甚至已经达到人的肉眼无法判别真伪的程度。

如果从技术的角度,Midjourney的进步无疑是让人惊艳和赞叹的。但可能也因为这些照片太过于真实和太多新用户的涌入,本周二,Midjourney宣布关闭了其免费账户的使用通道。分析认为,此举也是为了防止更多离谱的“照片”出现,从而扰乱现实世界和散布有害信息。

比如,此前真的就有媒体以把特朗普被捕的生成图片当成了真实现场照片,从而造成了虚假新闻的出现和发酵。此外,Midjourney目前的关键词审核机制并不严格,因此也存在产生大量有害照片的风险。Midjourney表示他们正在进一步加强对于AI生成内容的监管和审核。

图片来自于The Verge

| ChatGPT+Midjourney强强联合,AI作品走向商业化应用

目前,MidJourney仍然需要结合Discord使用,使用方法依然很简单,通过输入文字和一些参数要求描述即可。目前还支持用户上传自己的图片,再根据图片进行AI生成。

目前,一段完整Midjourney的“咒语”示例大概如下:

A man in futuristic armor with cyberpunk details(对想要呈现图片的文字描述,可以添加更多细节),shot on Canon R6 with 50mm f1.2(风格描述,可以提出是什么设备拍摄的、或者是以哪位知名艺术家或摄影师的风格),--v 5(使用第五代版本技术)--ar 4:6 (画幅比例,V5 版本中你可以自定义任何比例)--iw 1(输入的参考图片的权重占比)

虽然咒语的构成并不算复杂,但对于很多只有一个模糊想法的普通用户来说,如何让Midjourney来画出自己脑中图像仍然比较困难。于是,ChatGPT也登场了

ChatGPT能发挥什么作用呢?首先你可以模糊地描述你的构想,让ChatGPT拓展成一个充满细节的画面描述,接着让它从这段文字描述中提取关键词。然后,你可以将Midjourney的提示句的语法构成告诉ChatGPT,再通过几次训练让Midjounery记住如何通过你输入的关键词来创建Midjourney的命令语法。

之后你只需要复制粘贴ChatGPT给你的指令粘贴到Midjourney的命令框里即可生成图片,如果你不满意还可以让ChatGPT来继续帮你修改完善关键词。

目前,已经有很多人已经在尝试将ChatGPT和Midjourney结合产出的结果,应用于自己的工作中。比如,做电商的不再需要去花大价钱去找摄影师、设计师,而是只需要把产品图片和关键词提供给AI工具,就能直接生成商业大片。

图片来自小红书博主,账号:阿汤娇娇啊、阿泰ATAI动态视觉

未来甚至也不用找真人模特了,直接用AI生成就行。

有人将其用于室内家居设计领域,帮助自己来做网站、生成宣传图片等。

可以预见的是,ChatGPTMidjourney的合作可能仅仅只是AI商业化应用的一个开端。随着AI技术的快速发展,各种工具的出现让AI的应用范围也会指数级的扩目前,在设计、电商、广告、游戏、影视等各个领域都涌现出了更多的用例,在娱乐性大大增强的同时,全新的机遇赛道也在被开启。

最后,让我们来做一个无奖竞猜。以下两张烤鸡的图片中,你认为到底哪一张才是由真的相机拍摄的呢?

认为是上边这张请在评论区留1,认为是下边这张的请留2。欢迎大家参与!

注:封面图来自于博主AI船长,版权属于原作者。如果不同意使用,请尽快联系我们,我们会立即删除。

END




喜欢这篇文章?



1)点击右下角的“在看”
2)分享到你的朋友圈和微信群
3)赶快关注硅星人吧!
关注硅星人,带你用本地视角看硅谷,全球视野看创新





微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
逼真到颤抖!Midjourney画出完美中国情侣,画师、演员、模特一键淘汰领悟圣经的新亮点请教各位老大:房客报告门前草地突然干枯是咋回事?有图有真相ChatGPT+Midjourney可量产“宫崎骏”!AI将会让多少设计师失业?比流浪地球更魔幻,比满江红更狗血Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了有图有真相!温哥华美女曝光某著名滑雪教练,欠钱不还还骂人!灰指甲不治疗会怎么样?有图有真相终于等到中文版Midjourney!无需梯子,不限次数,快来参加内测邀请!AI作画神器Midjourney停止免费试用:一段实操视频在中国爆火后,大量新用户涌入致服务瘫痪有图有真相!2000多年前的烤串,了解一下!有图有真相,Gigi推荐的白色V 领T 烘干前后对比实验失眠日记 2013.1.30AIGC教程:Midjourney高效制作伪3D游戏场景、还有动态和光照?699报班学Midjourney亏不亏?0基础教程+全套关键词免费领取[369期]iPhone 15 拍照将迎大升级/Midjourney 官方中文版来了/王者荣耀女装定价超千元煮屁话禅茶(七)屁用不顶“视频领域的Midjourney”!AI视频生成新秀Gen-2内测作品流出,网友直呼太逼真AIGC付费时代加速到来?Midjourney暂停免费使用风格强化、极致动漫美学,绘画神器Midjourney迎来二次元升级3分钟一个大片!视频版Midjourney上线iPhone,网友实测太绚了|免费体验为把特朗普送进监狱,有多少人偷偷在Midjourney上充了钱?人工智能Midjourney,AI绘画全套关键词来了! [ 第370期 ]Midjourney升级!画出完美中国情侣,演员、模特、画师一键淘汰苹果iOS 16.5公测版发布/Bing 将迎来更多广告/Midjourney 停止免费试用时尚教皇爆红,网友直呼太潮!Midjourney出图骗过全世界美国版权局:通过ChatGPT、Midjourney等AI自动生成的作品,不受版权法保护美债会不会违约? 市场认为概率很大,有图有真相人人能用Midjourney作画,艺术还有门槛吗? | 编辑部聊天室Prompt Engineer也保不住工作了!Midjourney发布图片生成Prompt功能“Describe”ChatGPT+Midjourney,一卷卫生纸拍出科幻大片!200万网友围观我用GPT4 + Midjourney v5把《三体》的主角都画出来了AIGC教程:如何使用Midjourney节省70%时间,制作3D游戏角色Midjourney:AIGC现象级应用,一年实现1000万用户和1亿美元营收收藏这篇 Midjourney 使用大全 你也能享受 AI 绘画的快乐中美AI的魔性作图大比拼|鱼香肉丝?By文心一言|DALL-E|Midjourney爆火情侣竟不是真人!新版Midjourney效果炸裂,网友:太可怕了薄如蝉翼的美味
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。