Redian新闻
>
OpenAI CEO谈AI画图明星DALL·E 2:技术突破不多,地气接了不少

OpenAI CEO谈AI画图明星DALL·E 2:技术突破不多,地气接了不少

公众号新闻
Alex 发自 凹非寺
量子位 | 公众号 QbitAI

今年都快年末了,蹦出来一个ChatGPT,然后光速走红,服务器都被挤爆好几回。

而往前一看,这样的火爆场面,在4月份DALL·E 2发布时也出现过。

不同圈子的人纷纷下场搞起了AI创作,而且现在仍在继续。

在AIGC(AI生成内容)狂欢之际,有家公司微微一笑——赢麻了。

没错,就是同时手握ChatGPT和DALL·E 2的OpenAI

作为OpenAI的CEO,Sam Altman在与MIT科技评论交流时,讲述了他们成功背后的故事,并谈到了DALL·E 2教会他的三件事。

图源:MIT科技评论

学会了哪的三件事

1、 DALL·E 2跨越了一个门槛,图像作品传播性出色

首先,谈及“DALL·E 2为什么产生了如此大的影响”,Sam认为:

因为DALL·E 2跨越了一个门槛,生成的图像可以很逼真。

比如古罗马式的蜘蛛侠雕塑。

但即使是抽象风格,AI也能轻松拿捏,它可以很好地理解概念、巧妙地组合事物。

——这种感觉就像AI拥有了自己的智慧。

而这种灵活且出色的图像处理能力,之前的第一代DALL·E是几乎没有的,可以说DALL·E 2完成了大跨越式的升级。

另外,Sam还提到,

图像比文字或代码等更形象有趣,有一种情感力量。

也就是说,DALL·E 2生成的作品,传播性好,对于普通人来说更加亮眼有吸引力

用大白话说,这就叫:接地气!

虽然其实就资深科技圈内部来说,开创语言大模型时代的GPT-3似乎更震撼,但世界上其他人对DALL·E 2的惊奇程度,远远超过了GPT-3。

2、小小的改变,产生了大大的影响

至于DALL·E 2成功的过程经历,其中一点,大概可以用“一石激起千层浪”来形容。

Sam坦言,关于DALL·E的最初想法,其实是一个3人小组,在OpenAI大楼的某个角落里讨论探究出来的。

他表示,这是个关于扩散模型的简单想法,在算法上也就是一个小小的突破;不过效果嘛,后来大家也都看到了,可谓艳惊四座。

也许有时候只需要一些小小的改变,就能把做的不那么好的东西,变成能对世界产生巨大影响之物。

另外,Sam还表示,DALL·E 2是第一个大家都在使用的AI。

这个AI能自己一口气创作出完整的作品,比一般的AI工具更拟人化,你告诉AI你想要什么,它就给画出来——这仿佛是在和一个艺术家交谈。

而像Copilot等AI,虽然编程水平确实很强大,但仍然需要用户人为地做出不少操作,工具感强烈。

3、 DALL·E 2与艺术家的关系需要改善,它很有潜力

最后,再来说说DALL·E 2对社会带来了哪些影响。

这个AI成功地惊艳了众人,但它带来的影响不完全是积极的。

尤其是对于艺术家而言,他们似乎一下子被卷入了一场大型动荡。

一些人即将失去工作,一些人将找到新的机会,还有人走向了法庭,因为AI训练用的部分图像涉嫌盗用,侵犯了原创者的权利。

曾在梦工厂动画公司工作的数字艺术家Allen Stevenson吐槽说:“这让创作者们措手不及,在使用DALL·E的第一个月,我就陷入了被抢饭碗的危机。”

Sam其实也在密切关注着艺术创作者们,他提出了一个平衡艺术家和AI关系的构思:

如果你为AI的训练贡献了数据,那你就能以某种方式拥有这个模型的一部分。

实际上,除了DALL·E 2,其他AI绘画工具也同样都面临着版权问题等,大家也在思考解决办法。

就拿Stable Diffusion来说,其背后的Stability.AI公司与艺术家夫妇Mat Dryhurst和Holly Herndon展开合作:

他们共同建立了一个网站,将允许艺术家在用于训练Stable Diffusion的数据集中搜索自己的作品。

对于下一代Stable Diffusion,艺术家如果在训练素材中发现了自己的作品,可以选择直接删掉。

但无论如何,AI绘画已经势不可挡了。Sam表示,未来插画师同一段时间内能做的事情会增加,甚至是呈10倍或100倍地增加。

这对就业市场有什么影响,很难说,“应该会有新的工作,但中间也会有个过渡。”

另外,Sam认为,DALL·E 2对于整个社会来说,具有很大的效益和潜力。

他自己就用DALL·E 2对房子进行了改造,把AI创意用于建筑设计上,效果相当不错。

还有他的朋友要结婚时,他们的个人网站上,每一个小部分都有DALL·E 2生成的图像,个性十足。

最后,Sam表示,他们当然不会止步于DALL·E 2,他们希望制造强大的人工智能,能像人类一样理解世界,能帮助人类完成更多有用的事情。

参考链接:
[1]https://www.technologyreview.com/2022/12/16/1065255/sam-altman-openai-lessons-from-dall-e-2/
[2]https://www.technologyreview.com/2022/12/16/1065005/generative-ai-revolution-art/

「2022人工智能年度评选」榜单揭晓

领军人物TOP30


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
去年营收近19亿美元,Supercell CEO发公开信:艰难挑战如何面对?腾讯云的2022:降本降得差不多,明年增效靠自研产品|焦点分析三星DRAM,市占下滑re:Invent 首日:硬件创新加速,Serverless 冷启动技术突破Supercell CEO年收入4亿成芬兰纳税冠军,手游公司Reworks老板亚军再议胡主席二十大被架走事件专访中合基因|天使轮获数千万元融资,专注合成生物学底层技术突破,计划年内推出桌面式一体化Kb级基因合成仪拜登团队开始为其2024年大选做准备;德国第一座液化天然气接收站正式投入运营;美国将结束边境限制 | 每日大新闻WPP收购北美数字机构Fēnom Digital;凯捷旗下The Works公司公布新任命(广告狂人日报)大幅超越DALL·E 2和Imagen,斯坦福发布RA-CM3模型,融合检索与生成「DAS」完成近亿元融资,利用核心技术突破实现高端装备国产替代|早起看早期Meta最大规模裁员开启:技术岗难幸免,智能手表项目没了跌落神坛|媲美米其林的西雅图明星餐厅The Willows Inn宣布关门!【AIoT新维奖】技术突破榜发布!企业的一小步如何推动产业大跨步?百度开发者大会:技术信仰者的盛宴那年火车上的故事(下集)(十四)bāo huā shēng?bō huā shēng?桌面云:技术现状及行业场景百度副总裁马杰:技术、精神、审美设计让元宇宙成真趣图:技术面试前 vs 到岗后雾.湿地Cocos CEO林顺:技术创新没有捷径可言Pancake的光学密码:一场技术突围与商业落地之间的博弈中华芯片捷报频传,长电科技4nm技术突破后,龙芯再传喜讯3秒复制任何人的嗓音!微软音频版DALL·E细思极恐,连环境背景音也能模仿ChatGPT代笔推理小说:谋杀破案剧情一气呵成,已瞒天过海出版26部,封面也拿DALL·E画蜂巢能源奋战TWh时代:技术与制造双重发力日本发展半导体代工意图明显,传递的信号发人深思NEWS | 西雅图明星餐厅The Willows Inn跌落神坛,宣布关门我的“反动”姥爷波心之中碳捕集、碳封存、碳利用:技术减碳新模式效率碾压DALL·E 2和Imagen,谷歌新模型达成新SOTA,还能一句话搞定PS别人恐惧我贪婪,三星DRAM的又一次豪赌OpenAI CEO谈GPT-4:今年发不发不确定,我们没有AGI,或许让大家失望
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。