Redian新闻
>
OpenAI CEO谈AI画图明星DALL·E 2:技术突破不多,地气接了不少

OpenAI CEO谈AI画图明星DALL·E 2:技术突破不多,地气接了不少

公众号新闻
Alex 发自 凹非寺
量子位 | 公众号 QbitAI

今年都快年末了,蹦出来一个ChatGPT,然后光速走红,服务器都被挤爆好几回。

而往前一看,这样的火爆场面,在4月份DALL·E 2发布时也出现过。

不同圈子的人纷纷下场搞起了AI创作,而且现在仍在继续。

在AIGC(AI生成内容)狂欢之际,有家公司微微一笑——赢麻了。

没错,就是同时手握ChatGPT和DALL·E 2的OpenAI

作为OpenAI的CEO,Sam Altman在与MIT科技评论交流时,讲述了他们成功背后的故事,并谈到了DALL·E 2教会他的三件事。

图源:MIT科技评论

学会了哪的三件事

1、 DALL·E 2跨越了一个门槛,图像作品传播性出色

首先,谈及“DALL·E 2为什么产生了如此大的影响”,Sam认为:

因为DALL·E 2跨越了一个门槛,生成的图像可以很逼真。

比如古罗马式的蜘蛛侠雕塑。

但即使是抽象风格,AI也能轻松拿捏,它可以很好地理解概念、巧妙地组合事物。

——这种感觉就像AI拥有了自己的智慧。

而这种灵活且出色的图像处理能力,之前的第一代DALL·E是几乎没有的,可以说DALL·E 2完成了大跨越式的升级。

另外,Sam还提到,

图像比文字或代码等更形象有趣,有一种情感力量。

也就是说,DALL·E 2生成的作品,传播性好,对于普通人来说更加亮眼有吸引力

用大白话说,这就叫:接地气!

虽然其实就资深科技圈内部来说,开创语言大模型时代的GPT-3似乎更震撼,但世界上其他人对DALL·E 2的惊奇程度,远远超过了GPT-3。

2、小小的改变,产生了大大的影响

至于DALL·E 2成功的过程经历,其中一点,大概可以用“一石激起千层浪”来形容。

Sam坦言,关于DALL·E的最初想法,其实是一个3人小组,在OpenAI大楼的某个角落里讨论探究出来的。

他表示,这是个关于扩散模型的简单想法,在算法上也就是一个小小的突破;不过效果嘛,后来大家也都看到了,可谓艳惊四座。

也许有时候只需要一些小小的改变,就能把做的不那么好的东西,变成能对世界产生巨大影响之物。

另外,Sam还表示,DALL·E 2是第一个大家都在使用的AI。

这个AI能自己一口气创作出完整的作品,比一般的AI工具更拟人化,你告诉AI你想要什么,它就给画出来——这仿佛是在和一个艺术家交谈。

而像Copilot等AI,虽然编程水平确实很强大,但仍然需要用户人为地做出不少操作,工具感强烈。

3、 DALL·E 2与艺术家的关系需要改善,它很有潜力

最后,再来说说DALL·E 2对社会带来了哪些影响。

这个AI成功地惊艳了众人,但它带来的影响不完全是积极的。

尤其是对于艺术家而言,他们似乎一下子被卷入了一场大型动荡。

一些人即将失去工作,一些人将找到新的机会,还有人走向了法庭,因为AI训练用的部分图像涉嫌盗用,侵犯了原创者的权利。

曾在梦工厂动画公司工作的数字艺术家Allen Stevenson吐槽说:“这让创作者们措手不及,在使用DALL·E的第一个月,我就陷入了被抢饭碗的危机。”

Sam其实也在密切关注着艺术创作者们,他提出了一个平衡艺术家和AI关系的构思:

如果你为AI的训练贡献了数据,那你就能以某种方式拥有这个模型的一部分。

实际上,除了DALL·E 2,其他AI绘画工具也同样都面临着版权问题等,大家也在思考解决办法。

就拿Stable Diffusion来说,其背后的Stability.AI公司与艺术家夫妇Mat Dryhurst和Holly Herndon展开合作:

他们共同建立了一个网站,将允许艺术家在用于训练Stable Diffusion的数据集中搜索自己的作品。

对于下一代Stable Diffusion,艺术家如果在训练素材中发现了自己的作品,可以选择直接删掉。

但无论如何,AI绘画已经势不可挡了。Sam表示,未来插画师同一段时间内能做的事情会增加,甚至是呈10倍或100倍地增加。

这对就业市场有什么影响,很难说,“应该会有新的工作,但中间也会有个过渡。”

另外,Sam认为,DALL·E 2对于整个社会来说,具有很大的效益和潜力。

他自己就用DALL·E 2对房子进行了改造,把AI创意用于建筑设计上,效果相当不错。

还有他的朋友要结婚时,他们的个人网站上,每一个小部分都有DALL·E 2生成的图像,个性十足。

最后,Sam表示,他们当然不会止步于DALL·E 2,他们希望制造强大的人工智能,能像人类一样理解世界,能帮助人类完成更多有用的事情。

参考链接:
[1]https://www.technologyreview.com/2022/12/16/1065255/sam-altman-openai-lessons-from-dall-e-2/
[2]https://www.technologyreview.com/2022/12/16/1065005/generative-ai-revolution-art/

「2022人工智能年度评选」榜单揭晓

领军人物TOP30


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
re:Invent 首日:硬件创新加速,Serverless 冷启动技术突破Cocos CEO林顺:技术创新没有捷径可言WPP收购北美数字机构Fēnom Digital;凯捷旗下The Works公司公布新任命(广告狂人日报)Supercell CEO年收入4亿成芬兰纳税冠军,手游公司Reworks老板亚军波心之中雾.湿地跌落神坛|媲美米其林的西雅图明星餐厅The Willows Inn宣布关门!碳捕集、碳封存、碳利用:技术减碳新模式NEWS | 西雅图明星餐厅The Willows Inn跌落神坛,宣布关门拜登团队开始为其2024年大选做准备;德国第一座液化天然气接收站正式投入运营;美国将结束边境限制 | 每日大新闻再议胡主席二十大被架走事件苹果三星看好的智能指环如何布局?长江学者王国兴:技术具备,用先发优势打开国内高端局专访中合基因|天使轮获数千万元融资,专注合成生物学底层技术突破,计划年内推出桌面式一体化Kb级基因合成仪趣图:技术面试前 vs 到岗后Meta最大规模裁员开启:技术岗难幸免,智能手表项目没了OpenAI CEO谈GPT-4:今年发不发不确定,我们没有AGI,或许让大家失望日本发展半导体代工意图明显,传递的信号发人深思3秒复制任何人的嗓音!微软音频版DALL·E细思极恐,连环境背景音也能模仿「DAS」完成近亿元融资,利用核心技术突破实现高端装备国产替代|早起看早期大幅超越DALL·E 2和Imagen,斯坦福发布RA-CM3模型,融合检索与生成百度开发者大会:技术信仰者的盛宴效率碾压DALL·E 2和Imagen,谷歌新模型达成新SOTA,还能一句话搞定PS【AIoT新维奖】技术突破榜发布!企业的一小步如何推动产业大跨步?去年营收近19亿美元,Supercell CEO发公开信:艰难挑战如何面对?ChatGPT代笔推理小说:谋杀破案剧情一气呵成,已瞒天过海出版26部,封面也拿DALL·E画那年火车上的故事(下集)(十四)bāo huā shēng?bō huā shēng?中华芯片捷报频传,长电科技4nm技术突破后,龙芯再传喜讯Pancake的光学密码:一场技术突围与商业落地之间的博弈百度副总裁马杰:技术、精神、审美设计让元宇宙成真桌面云:技术现状及行业场景张朝阳周鸿祎谈ChatGPT出圈:技术进步要有全球视野腾讯云的2022:降本降得差不多,明年增效靠自研产品|焦点分析蜂巢能源奋战TWh时代:技术与制造双重发力我的“反动”姥爷
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。