Redian新闻
>
ChatGPT取代人类怕是个笑话,写程式错误率超过50%……
avatar

ChatGPT取代人类怕是个笑话,写程式错误率超过50%……

blue777
楼主 (北美华人网)
研究发现,OpenAI的ChatGPT在写程式上给的建议,正确率竟不到50%,仅有48%正确,另外在所有回答中,有77%过于冗长,不过由于ChatGPT的写作风格如教科书般自信,也误导了一些人类,导致有近4成(39.34%)的回答,人类无法在正确时间内辨识出ChatGPT写错了。
Purdue University最近进行的一项研究,针对在程式设计领域的问答网站「Stack Overflow」上的517个问题,对ChatGPT进行了询问,之后再检查这些答案的品质和准确性。
结果发现,ChatGPT有52%回答不正确,只有48%正确,而在所有回答中,高达77%的回答过于冗长。
研究还找来12名具有不同编程专业水准的参与者,来给出他们对于ChatGPT回答的见解,结果显示,尽管参与者整体认为Stack Overflow上的回答品质较好,但由于ChatGPT在答案中,展现出全面、清晰且人性化的见解,有39.34%的题目会让参与者,进而忽略ChatGPT在回答中的错误信息。
研究认为,对于ChatGPT给出的答案,有必要仔细检查并纠正其中的错误,用户也要意识到,这类看似正确的ChatGPT答案相关风险。
avatar
huangs
2 楼
现在是这样,十年后呢?
avatar
sophia20
3 楼
科技在进步
avatar
tigerleihm
4 楼
回复 1楼blue777的帖子
给自己壮胆呢吧
avatar
zmbb
5 楼
错误率超一半了,还叫人工智能吗
avatar
minren
6 楼
中文错误报道满天飞,中文标题纯属误导“写程式错误率超过50%” 该实验中ChatGPT 回答「Stack Overflow」问题虽然只有48%正确,但是在「Stack Overflow」上问的问题都是程序员所解决不了的问题。如果让一般程序员回答它们,比这个比例还要低得多,或根本就回答不出来。甚至如果不是该问题的细微领域的高级程序员也回答不出来。能回答「Stack Overflow」问题的人,是在该细微问题领域的拿手者。 另外ChatGPT 已被更好的版本GPT4取代。
avatar
盐与胡椒
7 楼
chat GPT是一个文艺青年,文科专业,话很多,能说到点儿上的不多
avatar
Moscow79
8 楼
ChatGPT改改语法,补充润色一下各种文本都还可以,写 code要求高了点
avatar
lnghng
9 楼
ChatGPT改改语法,补充润色一下各种文本都还可以,写 code要求高了点
Moscow79 发表于 2023-08-11 06:44

GPT-4写code错误是会出一些,但让人写,通常也不是一步写对的,也是要debug几次才对的。你怎么知道stack overflow 上上传的code是人家一遍就写对的,不是在自家IDE上run到没错误才放上来的?
stack overflow 回答正确率能达50%,而且是没有试错机会,-遍就出来的结果,而且速度极快,你身边如果有这么一位同事,绝对会被认为挺牛的。缺点是他错的时候也信心满满,但写code不要紧test一下很容易发现。
avatar
QLXF
10 楼
中文错误报道满天飞,中文标题纯属误导“写程式错误率超过50%” 该实验中ChatGPT 回答「Stack Overflow」问题虽然只有48%正确,但是在「Stack Overflow」上问的问题都是程序员所解决不了的问题。如果让一般程序员回答它们,比这个比例还要低得多,或根本就回答不出来。甚至如果不是该问题的细微领域的高级程序员也回答不出来。能回答「Stack Overflow」问题的人,是在该细微问题领域的拿手者。 另外ChatGPT 已被更好的版本GPT4取代。
minren 发表于 2023-08-11 06:05

你要知道,chatgpt是不会创造原创内容的,它只会根据各个数据源进行分析提取找到一个它认为最合适的。 所以,如果数据被污染了,chatgpt什么做不了。 这就是为什么openai还在找人工一个一个的去除数据污染。
avatar
xdhong
11 楼
回复 8楼Moscow79的帖子
事實證明許多不難的code 經過使用者的引導 它真的能寫個七七八八 在那基礎上改效率高多了

avatar
WhatAgain
12 楼
回复 1楼blue777的帖子
文科生编程序
相关阅读
周五了,开个灌水闲聊贴莫言说的很有道理,又有几个人听进去了呢重拳出击!我国破获一起美国中央情报局间谍案【冯站长说安全】2023年8月11日寻人:47岁中国女子带数千美元赴美国见男网友却失踪暴风雨来了!北京重庆等多地公布医药反腐举报方式请问一下大家,sat在高中什么时候考会比较好?人间温暖点滴几个财务自由的帖子都是靠买租售比极高的房子Sephora 的8折亲友会开始了,大家都打算买些啥2023年8月11日(周五)冯站长之家三分钟晚间新闻GPT-4「变笨」被斯坦福实锤:短短仨月数学问题错误率暴涨40倍!OpenAI也急了:已开始调查觅刘郎《灼灼风流》也要来了,定档0819,好多熟人啊吐槽:产后亲妈不好相处。。。。朋友恒大地产已经资不抵债了双林奇案录第三部之川黔连环案: 第二十三节火星乐园第三部《灰界》第二十五章 黑丝之谜GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员裁员后作为被留下的该做什么迪拜喷泉灯光秀🎉8月10日🎉 旅游部批准🎉 中国游客组团赴美旅游🎉ChatGPT再掀波澜,大模型+XR取代人类医生?第一章 个体的行为法则(3)中美两国都在抓间谍大家说说在美国能买到的哪种速冻饺子🥟最好吃😋吧父母养老问题,大家来给点意见克罗地亚枪声中国过度医疗太严重了,早该整一整了盛夏八月,婆婆非要开暖气,无语死北京强降雨致11人遇难,其中2人在抢险救灾中因公殉职【冯站长说安全】2023年8月1日扎克伯格公开怒斥马斯克炒作;被停职的王军传重回华为车BU;王小川称用电脑工作时间越长越会被ChatGPT取代丨雷峰早报闲聊一个50岁未婚未育的白男生活英伟达推出最强生成式AI处理器;研究称ChatGPT回答编程问题的错误率超50%|AIGC周观察第十四期泽连斯基战争前后的容貌对比,沧桑了苏珊米勒每日运势2023年8月11日在家上班养成的一个不好的习惯,版上有同款吗巴黎市长将重修Châtelet 广场以方便行人肝癌靶向治疗最新方向宇宙类似原子,以薛定谔方程运行,上帝就是方程的最大解:最大波函数
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。