Redian新闻
>
ChatGPT死活不认27能被3整除,网友:不是说AI要统治世界了吗?

ChatGPT死活不认27能被3整除,网友:不是说AI要统治世界了吗?

公众号新闻
Alex 羿阁 发自 凹非寺
量子位 | 公众号 QbitAI

让众人疯狂的网红AI ChatGPT,原来也有明显的短板?

一段“网友调教这只AI”的聊天记录,在网上传开了。

可以看到,AI起初居然说27是个质数。

在网友向其提出质疑后,AI仍嘴硬称“27不能被3整”。

网友不得不和AI“大战几百回合”,最后在人类锲而不舍的教导下,AI才终于终于低头认错。

上述图源:微博@沙雕文案 援引网友空间截图

有一说一,AI的认错态度倒是很好。

有围观者看完后调侃:AI不是都要统治世界了吗,怎么会输给一道简单的数学题?

不过,也有很多人为ChatGPT说话:这么坦诚的认错态度,不比某些人强多了


数学水平拉胯,还贼固执

具体事情是这样的:

网友在和ChatGPT互动的过程中发现,这只AI数学水平过于拉胯,连27是不是质数这种简单问题都能搞错——而且还是在知道质数定义的情况下……

于是网友让ChatGPT证明它给出的结论,没想到,AI居然说27不能被3整除。

网友表示无语,但还是耐着性子又问了一遍,结果AI依然嘴硬,偏把9说成是9.0。

无奈,网友只能搬出代码,试着用Python来教会AI。

结果AI还真学会了!而且人家还主动承认了刚才的错误。

有意思的是,我们刚才也去问了ChatGPT“27是不是质数”,发现它已经改过来了。

然后我们又拿了几个数字去问AI,结果在这一回合中,它都正确地判断了一个数到底是不是质数。

不过仔细一看,AI并没提到35能被7整除,于是我们又专门问了一遍。然鹅……

这岂不是一本正经地胡说八道嘛?

于是我们也只好搬出Python教教它,但这回,连python似乎也没能让AI承认自己的错误……

所以这只AI为啥算术水平如此堪忧,而且还如此固执?

其中一个重要的原因就是,ChatGPT是个语言大模型,根据Open AI的GPT-3.5的模型微调而成,它擅长逻辑推理,但并不能执行标准的计算机算法。

而且与搜索引擎不同,它目前也没有网页浏览功能,无法调用在线计算器。

此前,ChatGPT其实已经向用户坦言,它不懂算术。两位数的乘法或许还凑乎,但遇到三位数的乘法,人家直接不干了。

我们也去问了一遍,现在AI到是直接给了个答案,不过是错的。(正确答案为186524)

另外,ChatGPT一般不会根据用户的反馈来纠正自己的答案,但如果用户提出了额外的信息,有时也能辅助AI优化答案。

所以,我们暂时没有成功地“教育”AI,大概也许可能是运气不太好……

除了数学其他都很全能

尽管ChatGPT有时会展现出“人工智障”的一面,但不得不说,大多数时候它的表现还是很优秀的。

比如,哥伦比亚大学教授、谷歌工程师Kenneth Goodman就分享,ChatGPT已经做好成为律师的准备了!

律师执业考试中,ChatGPT的正确率高达70%(35/50)


不仅是法律方面,Goodman还让ChatGPT参加了其他不同领域的各种考试,都取得了很高的成绩。

包括美国医师执照考试(USMLE),拿掉其中的图像选择题后,ChatGPT同样做到了70%的正确率。

为了防止ChatGPT的训练数据中包含这些题目,Goodman还特意选取了纽约州2022年8月最新化学注册考试

去除5个图片选择题,ChatGPT的正确率为77.7%(35/45)

同样批次的英语考试中,ChatGPT的正确率甚至达到了91.6%(22/24)

有网友已经开始预测,或许我们每个人都将拥有自己的律师AI了,咨询律师的费用也会大大下降。接下来就是医生AI、营养师AI……

怎么样,你看好ChatGPT的未来应用吗?(或者你有让它学好数学的建议吗?

参考链接:
[1]https://weibo.com/7095186006/Mj6LVF0zS#comment
[2]https://twitter.com/TonyZador/status/1601316732689604608
[3]https://twitter.com/pythonprimes/status/1601664776194912256

量子位「MEET2023智能未来大会」

倒计时2日,即将线上直播


点这里关注我 👇 记得标星噢 ~


一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
够快!爆火的ChatGPT等价开源项目来了,网友:我担心跑不起来反击!Google 版 ChatGPT 首次亮相,有一个功能「碾压」ChatGPT捷克已经统治色情世界了Stable Diffusion被起诉!结果人类律师水平拉胯,网友:还不如ChatGPT帮他写重磅!微软发布 ChatGPT 版搜索引擎,用上了比 ChatGPT 更强大的技术Stack Overflow临时禁用ChatGPT生成内容,网友:人类和AI快打起来!ChatGPT到底有多聪明?我测试了ChatGPT的数学能力杨斌:2023能被几整除,以及......ChatGPT竟写出毁灭人类计划书,还给出相应Python代码,网友:AI正在指数级发展资本主义帝国瓜分不均爆发一战爆火的ChatGPT杀疯了!写代码、改bug,网友:可取代Stack Overflow了法国男子38岁生日,妻子给他送了一场火山爆发?!网友:不顾死活的浪漫...专栏 | ChatGPT会开启人工智能统治时代吗下载量暴增10倍!微软必应集成ChatGPT后需求大爆发;4省份上调最低工资标准;淘宝已屏蔽ChatGPT关键词丨邦早报紧急提醒!ChatGPT成神器!但这些“ChatGPT”是假的,小心被骗!刚刚,ChatGPT官宣数学能力再升级,网友:终于精通十以内加减法了金融民工会因为ChatGPT下岗吗?刚刚,我问了ChatGPT 24个金融圈灵魂问题爆火的 ChatGPT 太强了!写代码、改 bug,网友:可取代 Stack Overflow 了ChatGPT因访问量激增崩了;抖音否认3月1日上线外卖服务;百度将于3月推出ChatGPT产品丨邦早报ChatGPT通过谷歌程序员面试,薪资达18.3万美元!ChatGPT通过谷歌程序员面试,薪资达18.3万美元!孟晚舟将首次出任华为轮值董事长/ 百度All in类ChatGPT项目/ 知乎因ChatGPT大涨50%…今日更多新鲜事在此“印度人”当选英国首相后,距离“印度统治世界”还差几步?剽窃、作弊,ChatGPT竟偷偷生成了12篇署名论文!Marcus炮轰Ta变成CheatGPT别紧张,ChatGPT离统治人类还早得很自制九层塔甜酱【人人都能欣赏的数学证明】整除判别法警报四起,危机四伏。。老胡能被ChatGPT所代替吗?百度版ChatGPT确定为“文心一言”/ 戴尔裁员5%/ 苹果要开会应对ChatGPT…今日更多新鲜事在此给ChatGPT喂黑话学得贼快,网友:你把AI教恶心了我们还怎么玩?深秋恩赐的味觉(2)山珍 零余子为什么ChatGPT这么强?—— 一文读懂ChatGPT原理!华尔街交易员为何不担心ChatGPT抢饭碗?ChatGPT:我预测不了市场康德的《纯粹理性批判》之写作目的ChatGPT专业版可以排队了!限制更少但收费,网友:钱已备好
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。