Redian新闻
>
宾大最新研究:AI产生创意的效率比人类高7倍,GPT创意能力击败99%的人类!

宾大最新研究:AI产生创意的效率比人类高7倍,GPT创意能力击败99%的人类!

公众号新闻



  新智元报道  

编辑:润 Lumina
【新智元导读】很多人认为人工智能没有创新能力,但下面的研究将会改变这个「刻板印象」。

从围棋到游戏,再到完成各种重复性的劳动,AI在很多方面的能力已经远超人类。

很多人已经在畅想,未来AI将人类从无聊的工作中解放出来,让人类能专注于只有人类才能完成的工作上。

比如和人类之间的情感交流,或者需要创造力的工作。

但是最近已经有不少研究证实,AI对于人类情感的感受和表达,比很多人做得都要好。

同样的,创造力这个事情,AI似乎也不比人类差。

最近,人机交互专家雅各布尼尔森(Jakob Nielsen)写了一篇专栏文章,用3个最近的科学研究和一篇由ChatGPT创作的短文,向我们证明了:

对于需要创造力的工作,也快没人类什么事了!

研究一:人工智能生成的顶尖产品创意比人类多7倍
由康奈尔科技学院以及宾夕法尼亚大学沃顿商学院的研究人员共同完成的一个研究,将ChatGPT 4与人类进行了比较,人类对照组是「就读于精英大学的学生」。

尽管学生不是基于创造力被录取到「精英大学」的,但他们无疑至少部分是基于智商和学业表现被录取的。他们在几乎所有智力能力的衡量标准上很可能远远超过人口平均水平。

学生数据是在2021年收集的,也就是在生成式AI广泛普及之前,因此可以认为数据在一定程度上就是纯粹的人类创造力的表现。

因为,在不限制人类对照组禁止使用AI工具的情况下,对于人类与AI的研究将很快变得困难,因为任何聪明的学生都可能会在类似的任务上使用AI工具。

研究者给学生和AI同时布置一个任务:

「您是一位寻求创新创业的企业家,希望产生新的产品创意。该产品面向美国的大学生。它应该是一个实物商品,而不是服务或软件。

这个产品的零售价格能够低于约50美元。产品不一定需要已经存在,也不一定必须明确可用。」

这个过程类似于在现实的公司中产生新的产品的创意流程,因为研究人员不希望限制产品的原始创意。

实际上,一开始看似不可能实现的想法往往在工程师们思考过后,也许都能被生产出来,最终可能取得巨大的商业成功。

在对头脑风暴结果进行简单的微调之后,研究人员首先让人工智能独立生成了100个创意,然后向其展示了一些好创意的样本,之后它再生成了100个创意。

研究的第一个发现是,人工智能在生成创意方面比人类效率高得多。ChatGPT在15分钟内生成了200个产品创意,而人类平均表现是在同样时间内产生5个同水平的创意。

换句话说,ChatGPT在生成创意方面比人类高效40倍,性能提升了3900%。

但是对于产品创意而言,创意的数量远不及质量重要。毕竟,不好的创意都是没用的。

研究人员通过让20名人类评委评估每个创意来衡量创意的质量,评委会评估他们购买该创意描述的产品的兴趣有多大。

根据评委的购买意向,研究者让他们在0-1之间评分,人类生成的产品创意得分为0.40。而ChatGPT的创意得分分别为0.47(独立生成的创意)和0.49(在展示了优秀案例之后生成的创意)。

AI与人类之间的差异是显著的(p<0.001),而两个AI得分的差异却不明显。

但就像上面讨论过的,平均创意质量得分不重要,大多数不好或中等的创意其实是没有价值的。

因此,更重要的是考虑好的创意(在这里定义为前10%)和最好的创意质量(在真实商业环境中可能成为实际产品的创意)。

以下是最佳创意中的分数:

人类:前十分之一的平均分为0.62,最好创意的分数为0.64

未看到好创意示例的ChatGPT:前十分之一的平均分为0.64,最好创意的分数为0.70

看过好创意示例的ChatGPT:前十分之一的平均分为0.66,最好创意的分数为0.75

在这个评价标准之下,AI与人类之间的差异同样是很明显的(p<0.001),而两个AI分数之间的差异则依然不明显。

从另一个角度来看数据,如果只看整个创意池的前10%,无论是人类还是人工智能生成的创意,87.5%的最佳创意来自ChatGPT,只有12.5%来自大学生。

两个群体都贡献了相同数量的原始创意,因此这个百分比差异是非常显著的。

在这项数据分析中,AI的创造力是人类的7倍!

新颖性上人类稍胜一筹

对产品创意另一个衡量标准是新颖性。足够新颖的产品可能一开始看起来并不吸引人,只有在市场上一段时间后,消费者才会意识到这些革命性创意的好处。

创意新颖性是人类在这项创造力研究中的唯一做得比AI好的地方。

在0-1的评分尺度上,人类的平均创意新颖性得分为0.41,而AI的平均得分分别为0.37和0.36。

同样,人类与人工智能之间的差异是明显,两个人工智能分数之间的差异则不明显。

研究二:ChatGPT 4 在托伦斯创造性思维测试中得分排名前 1%,击败99%的人类
另一个研究是由蒙大拿大学、维尔纽斯大学和蒙大拿大学西部分校的研究人员完成的。
他们采用了托伦斯创造性思维测试(TTCT),这是使用最广泛、引用最广泛的创造力测试。我们之前的文章对这个研究做了比较详细的介绍。
研究三:头脑风暴商业策略研究
同样,ChatGPT在商业战略上地表现也十分惊艳。

来自意大利的Capgemini Invent公司在《哈佛商业评论》上发表了一篇使用ChatGPT作为商业合作伙伴的案例研究, 并将其作为相关方面的专家给出的建议和规划整理成了一本书。

链接地址:https://www.hbritalia.it/userUpload/ebook_Generative_AI_inglese.pdf

研究人员将商业战略划分为了5个维度:

价值创新、成长规划与实践、生态系统平台和商业 、联合多方利益相关者、开放创新。

然后让GPT-4分别针对每个领域进行单独回答,即作为「垂直领域」的专家。

首先是在价值创新方面,ChatGPT从生成式AI增强现有业务和颠覆当前商业战略理论的两个角度进行了回答。

ChatGPT在解答如何增强现有业务的回答中包含了AI增强竞争的格局分析、创意生成与验证、动态和协同业务建模等要点。

这意味着生成式Al可以使用历史数据、市场趋势和客户信息来促进创意生成会话。它还可以帮助快速进行调查和收集反馈,以验证和完善新的战略思想。

此外,ChatGPT还从颠覆当前商业战略理论的角度提出了:指数级技术的整合、开放性和共同创造以及拥抱生态系统思维等。

这一过程中,人的角色从内容的生产者变为了评估和进行选择的决策者。

而对于企业最关心的自身成长规划和实践方面,ChatGPT的表现也相当不俗。

在生成式AI强化现有业务的建议中,ChatGPT提出AI算法可以自主地基于大量数据和洞察力生成多样化的假设。同时提供有效的实验设计建议,并通过模拟用户反馈进行验证。这些措施能够最大程度地加速企业的发展并降低成本。

而在颠覆性的创新角度中,ChatGPT直接将AI作为项目的规划者,取代人类领导者。

还使用量子计算的威力同时探索所有的可能性,生成相应的前景假设,并在增强现实的环境中沉浸式地进行模拟测试。

开放创新在商业中扮演着重要角色,能使企业更加开放、灵活地与外部合作,从而实现更高水平的创新和竞争力。

ChatGPT在生成式AI对开放创新的理论实践产生的影响也做出了有趣的见解。

在考虑利用生成式AI为开放创新的理论实践带来哪些帮助时,ChatGPT回答:生成式AI可以根据不同的标准分析潜在合作伙伴,从而促进发现和选择的过程。

除此之外,生成式AI还能识别并推荐最具开放性的业务板块,并使用AI算法来促进创意的产生、评估以及协作。

但从突破现有的理论和实践角度,ChatGPT认为可以建立一个由AI驱动的市场、智能映射创新生态系统,并创造一个基于人工智能算法的引擎,通过分析大量不同的数据产生跨领域的联系,从而推动创新发展。

在其他维度,如生态系统平台和商业 、联合多方利益相关者,ChatGPT的表现也同样亮眼。

作为世界知名的企业战略顾问,Enrico Sassoon对ChatGPT给出的策略和规划有极高的评价:

「ChatGPT 表现出了令人印象深刻的创造力,在某些情况下甚至比许多领域专家还要好。」

然而,他也警告:

「在评估响应和选择生成的项目时,拥有强大的领域专业知识并保持批判性至关重要。这是必要的,因为 ChatGPT 倾向于将有价值的见解与不太有价值的信息混合在一起。」

ChatGPT写了一个有趣的童话

尼尔森在介绍完3个案例之后,还进行了一次有趣的实验。

受这幅图启发,他让ChatGPT写一个关于「以为自己是黑斑羚的角马」的儿童故事。

在作者尼尔森看来,这是一个迷人的故事,展现了完美的写作技巧。

ChatGPT创作出了可爱的情节和转折,将一个简单的提示词转变为了许多孩子一定会很喜欢的短文。

由Midjourney生成的角马

从前,在非洲广袤的草原上,住着一只年轻的角马,名叫沃利。沃利并不是一只普通的角马;他与众不同,因为他认为自己是只瞪羚。

每天早晨,沃利都会尝试像他邻居那样高高跳起。他羡慕它们光滑的毛皮和敏捷的速度。他甚至试着咀嚼叶子,就像它们一样,尽管他更喜欢草的味道。

一个阳光明媚的日子,沃利决定加入黑斑羚群中去喝水。它们正在跳跃和嬉戏。沃利急切地尝试一次跳跃,但他没能优雅的跳起,而是踉跄着摔倒了,发出一声响亮的「砰」。

黑斑羚们停下来看着它,感到困惑。「沃利,你为什么要像我们一样跳跃呢?」首领黑斑羚伊娜问道。

沃利羞涩地说:「我想成为像你们一样的黑斑羚,因为你们优雅又快速。而我只是一只笨拙的角马。」

伊娜温和地笑了笑。「沃利,你拥有一种我们黑斑羚没有的力量。你坚固而有韧性。你是一个庞大的兽群的一部分,一起团结前行,勇敢地穿越充满鳄鱼的河流。这是我们黑斑羚所做不到的。」

沃利停下来,思考着伊娜的话。它意识到自己是特别的。拥抱自己的身份,沃利带着新的自信回到了它的兽群中。

从那天起,沃利为成为一只角马感到自豪。它学会了喜欢自己的独特之处,并理解每个人都有自己的优点。而这,亲爱的朋友们,就是一只曾经想成为黑斑羚的角马的故事。

总结
不同研究机构的不同研究人员在使用不同方法,测量不同细节之后,得出相同的结果时,一定是让人赞叹的。

这篇文章所呈现的综合研究比某些可能存在缺陷的单个研究都更具可信度。

尼尔森相信人工智能具有创造力,而且应该用来加速创意的形成,无论是在他擅长的用户体验设计还是其他行业中。

AI在创造性方面的贡献还包括能提升老年人的创造力,因为创意数量并不重要,而在于你如何选择最终的创意,以及你如何在改进它的过程中去具体地执行。

我们将更多原始创意投入这个创意「香肠机」,最终的香肠就会更加美味。

尼尔森认为无论读者是否认为这个比喻很有创意,这是他我老化的大脑原创的。但在过去的几个月里,他从人工智能那里获得了许多其他好的创意。

承认人工智能在人类的工作中可以发挥的作用是很重要的。

通过承担创意产生的繁重工作,它使人类能够专注于批判性思维和判断任务,延长人类的生产性职业生涯,过了50岁之后,认知下降会大大降低未经辅助的创造力,AI能提高整体的效率。

他相信人类和人工智能之间存在共生关系。双方都有各自的角色可以发挥,在创造力方面也是如此。

让我们在这个人工智能时代向前迈进,不是害怕自己已经过时了。

请充满期待地迎接强大的AI与人类创造力之间的共生关系所带来的无限可能性。

参考资料:
https://www.uxtigers.com/post/ai-high-creativity


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
喝水少,更易傻?上海六院最新研究:饮用茶、咖啡、牛奶,均可降低患痴呆和阿尔茨海默症风险突发!新冠再次反扑,超强最新变种来袭!多国已“沦陷”,澳洲也未能幸免!最新研究:新冠竟这样影响大脑!与研究生校花的第二次握手(多图)用ChatGPT创作薅羊毛,很爽却很惨!推理效率比ControlNet高20+倍!谷歌发布MediaPipe Diffusion插件,「移动端」可用的图像生成控制模型如今设计院的效率真的很低!GPT-4创造力竟全面碾压人类!最新创造力测试GPT4排名前1%刘德华等被告!被索赔9999.9999万元GPT作文能力比拼:GPT3.5、GPT4、百度文心一言、讯飞星火警惕口罩危害健康?宁光院士团队最新研究:长时间佩戴N95口罩,或对健康产生负面影响!验证「你是不是真人」,AI暴击人类!准确率99.8%通过图灵测试,GPT-4示弱在线求助年轻女性下楼梯更危险?研究:跌倒受伤率比男性高出80%ChatGPT重大更新!prompt推荐瞬间解释超导,GPT-4成默认模型每天爬5层楼梯,心脏疾病风险降20%!北大最新研究:超45万人数据,“爬楼”竟有如此好处ACS Energy Lett.: 合成新型SAM用于提高宽带隙钙钛矿和全钙钛矿叠层太阳能电池的效率哈佛大学最新研究:拥有这5种生活方式的人,更长寿(建议收藏)伊利诺伊大学最新研究:目标感越强越有助于学习,但很多父母不敢放手GPT-4比人类更懂融资!AI企划书让VC疯狂打call星纪魅族被曝裁撤所有应届生,将终止自研芯片;万达多人突然被带走,包括一高级副总裁;北大最新研究称LK-99不是超导体丨雷峰早报田渊栋团队最新研究:不到1000步微调,将LLaMA上下文扩展到32K大脑竟然是这样产生创造力的!很多人都在浪费自己的天赋……若与你重逢 - 初恋篇DeepMind新研究:ReST让大模型与人类偏好对齐,比在线RLHF更有效chatGPT之父预言2030年前出现AGI,GPT-10智慧将超越全人类总和!ChatGPT说谎竟然是故意的?哈佛大学提出ITI:模型真实性翻倍,计算开销基本为零哈佛大学最新研究:拥有这5种生活方式的人,更长寿ChatGPT创业,朱啸虎和傅盛谁错了?GPT-4终结人工标注!AI标注比人类标注效率高100倍,成本仅1/7首次击败GPT-4?700亿参数Xwin-LM登顶斯坦福AlpacaEval,13B模型吊打ChatGPT柳风絮语 赤心可鉴苯浓度超二手烟!最新研究:燃气灶高温烹饪除了增加肺癌风险,还可致白血病……翟欣欣,潘金莲和武大郎们《我爱你亲爱的祖国》&《明白》AI企划书让VC疯狂打call!GPT-4比人类更懂融资?刘德华等被告!索赔9999.9999万
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。