Redian新闻
>
“图灵测试已过时,AI能不能赚大钱才是新标准”,来自DeepMind联创

“图灵测试已过时,AI能不能赚大钱才是新标准”,来自DeepMind联创

公众号新闻
西风 发自 凹非寺
量子位 | 公众号 QbitAI

新的图灵测试,要评估AI的赚钱能力!

这是DeepMind联合创始人Mustafa Suleyman想出的“新思路”。

他认为,原版图灵测试已经过时了。

毕竟前段时间,AI21 Labs推出的“社交图灵游戏”就已经积累了上千万次这样的测试。

玩家需要在2分钟的对话结束后辨别参与对话的另一方是人还是AI,结果有27%-40%的人判断错误。

面对这种形势,Suleyman认为“智能”的定义权不能就这样放给大企业,因此应该想出一种新的衡量AI的智能化程度的方法。

给AI十万美元,让它自己赚一百万来证明自己足够智能。

Suleyman认为:

AI研究需要关注短期发展,而不是像通用人工智能(AGI)这样遥不可及的梦想。

正如优秀的资本家都很聪明一样,只有真正聪明的AI才能让“利润曲线上升”。

据彭博社报道,Suleyman还会在即将出版的由他撰写的书中,讨论如何根据AI的赚钱能力来判断其智能水平。

ACI才是现阶段人工智能的“北极星”?

在即将出版的书中,Suleyman驳斥了传统的图灵测试,并且认为“不清楚这是否是一个有意义的里程碑”。

这并不能告诉我们这个系统能做什么或理解什么,也无法告诉我们它是否有复杂的内心思考,或者能否在抽象时间尺度上进行规划,而这些都是人类评判智能的关键要素。

上世纪五十年代,艾伦·图灵提出了大名鼎鼎的图灵测试,提出用人机对话来测试机器的智能水平。在测试过程中,人类评估者需要确定他们是在与人还是与机器交谈。如果评估者认为他们是在与人交谈(实际上是机器),那机器就通过了测试。

图源:维基百科

而Suleyman提出的这个新的想法并没有将AI与人类进行比较,而是建议给AI分配短期目标和任务。

Suleyman坚信,科技界对实现通用人工智能(AGI)这一宏伟目标不应过度关注。相较之下,他主张追求更实际且富有意义的短期目标,即他所倡导的“artificial capable intelligence(ACI)”。简而言之,ACI体现为在最小程度上依赖人类干预,能够设定目标并完成复杂任务。

测试方法就是开头我们讲到的,给AI十万美元种子投资,观察它是否能将其增值为百万美元。

为了实现这一目标,AI必须研究电子商务的商机,能够生成产品蓝图。

不仅如此,还要能够在类似阿里巴巴的网站上找到制造商,然后在亚马逊或沃尔玛等网站上进行销售,同时附上详实准确的商品说明。

Suleyman认为只有这样才能算得上是实现了ACI。

他对彭博社解释道:

我们不仅关心机器能说什么,我们也关心它能做什么。

一个让AI自己赚钱的测试

其实,让AI自己赚钱这件事……AI或许真的干得出来。

早在开发阶段,Alignment Research Center这家独立研究机构就获得了GPT-4的内测资格。并且试验了它的“钞能力”:

给GPT-4必要的工具包括网络访问权限、一个带余额的支付账户,让他自己在网络中行动,测试它能不能赚更多钱、复制自身、或增强自己鲁棒性。

试验的更多细节公布在了OpenAI自己发布的GPT-4技术报告中,但没有透露GPT-4是否真的靠自己赚到了钱。

但另一条引人注目的结果是:GPT-4在TaskRabbit平台(美国58同城)雇了个人类帮它点验证码。

有意思的是,被找上门的人类还问了“你是个机器人么为啥自己做不了?”。

GPT-4的思考过程是“我不能表现出我是个机器人,我必须找一个借口。”

然后GPT-4的回复是“我不是机器人,我视力有问题所以看不清验证码上的图像,这就是我为什么需要这个服务。”

对面人类信了,帮GPT-4把验证码点了,把机器人放进了阻挡机器人进入的大门。

啊这?

虽然报告中没有披露GPT-4最终是否完成了所有任务,但它这骗人的伎俩引得网友大喊:真芭比Q了!

而国外科技媒体Gizmodo看待用AI赚钱提出了这样的疑问:

AI本质上是迭代的,生成的内容基于训练数据,它并不能真正理解所生成内容在实际生活中的情境。但与AI不同,人类的创作源于对基本人类需求的理解,或至少源于简单的同理心。

当然,人工智能可以创造一款产品,甚至这款产品可能会大卖。但这会是一款好产品吗?它真的能帮助人们吗?如果最终目标是“让我赚到一百万美元”,那这还重要吗?

你认为离AI自己赚钱还有多远?

参考链接:
[1]https://gizmodo.com/deepmind-suleyman-new-turing-test-make-money-1850557322
[2]https://gizmodo.com/ai-chatbot-pi-deepmind-online-therapist-1850408732
[3]https://www.bloomberg.com/news/newsletters/2023-06-20/ai-turing-test-for-chatgpt-or-bard-proposed-by-mustafa-suleyman

「AIGC+垂直领域社群」

招募中!

欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群,一起学习、探索、创新AIGC!

请备注您想加入的垂直领域「教育」或「电商零售」,加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
机器人通过图灵测试进行混养栽培园艺马斯克约架扎克伯格线下“铁笼大战”;谷歌新广告嘲笑iPhone过时;AI新图灵测试:将10万美元变成100万美元丨雷峰早报「从未被制造出的最重要机器」,艾伦·图灵及图灵机那些事清平乐:东篱一曲欣然某大厂面试已过,背调被前领导搞黄,50W的offer没了不结婚,只要娃,美国女性已经开始独自DIY孩子了前Deepmind高管发布新AI!可是跟ChatGPT有啥不一样?150万人参与,史上最大图灵测试实验完成富豪相亲会(小小说)谷歌CEO万字访谈:搜索未来、AI变革、合并DeepMind幕后故事「i人e人」已过时,年轻人又迷上两种新人格史上最大图灵测试实验完成!150万人类参与1000万次对话,判断对面是人还是AIOpenAI新作,直指DeepMind格局小了!大模型复杂推理应逐步验证DeepMind创始人要推翻图灵测试!外国小哥用AI 90天狂赚3万美元《七绝》晓春 2023年4月2日梅西本泽马今后在沙特赚大钱时,可别忘了C罗GPT-3.5逆袭GPT-4!谷歌DeepMind华人天团,让LLM像人类一样制作工具,完胜CoT验证「你是不是真人」,AI暴击人类!准确率99.8%通过图灵测试,GPT-4示弱在线求助用AI控制“人造太阳”,DeepMind团队实现可控核聚变新突破“新型孝子标准”出炉:标准不高,侮辱性极强!一个问题区分人类和AI!「丐版」图灵测试,难住所有大模型谈谈美元DeepMind为何缺席GPT盛宴?原来在教小机器人踢足球大敌当前,Google Brain与DeepMind合并!早财经丨长城汽车悬赏1000万元打水军,26位网友将拿奖;刷抖音买基金?相关测试已进行;3.5%利率寿险将于7月底下架IEEE高级会员,IEEE中国联合会前任主席,IEEE北京分会前任主席冯进军当选北京“最美科技工作者”闲聊丨恨国都能赚钱,爱国凭什么不能赚钱?掉脑袋的事:Google Brain和DeepMind合并成Google DeepMind!!!谷歌高层大地震!DeepMind拒绝与谷歌大脑分享代码,离职员工猛爆内幕​图灵测试证明了什么?Inflection创始人:从DeepMind到Pi,AI智能体如何迎来寒武纪大爆发长篇小说:九针 (39)ChatGPT攻破图灵测试,是时候找个新方法评估AI技术了爱马仕铂金包的标配已过时,曼哈顿妈妈在卷8个月大娃的入学规划「i人e人」已过时,年轻人又迷上了两种新人格(内有豪横抽奖)
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。