Redian新闻
>
ChatGPT 修 bug? 简直横扫全场~准确率达78%!程序员要开心了

ChatGPT 修 bug? 简直横扫全场~准确率达78%!程序员要开心了

公众号新闻

来自:量子位

ChatGPT到底有多会修bug?
这事终于有人正儿八经地搞研究了——
来自德国、英国的研究人员,专门搭了个“擂台”来检验ChatGPT的这项本领。
除了ChatGPT之外,研究人员还找来了其它三位修bug的“AI猛将”,分别让它们修复40个错误代码。
结果真是不比不知道,一比吓一跳。
ChatGPT准确修复了其中31个bug,遥遥领先第二名(21个),直接拿下“AI修bug界”的SOTA成绩!
于是乎,这项研究引来了众多网友的围观和讨论,Reddit上发布此帖的标题更是用上了“小心”、“注意”这样的字眼:
但事实上,这真的会让程序员“危”吗?
我们不妨先来看下这项研究。
很会修bug的ChatGPT
虽然ChatGPT并非是为了专门修改bug而生,但自打它问世以来,不少网友们都发现它是具备这项能力的。
因此研究人员为了摸清ChatGPT到底能修改bug到什么程度,便引入了标准的错误修复基准集QuixBugs来进行评估。
以及与它同台竞技的AI选手,分别是CodeX、CoCoNut和Standard APR。
研究人员从QuixBugs中挑了40个问题,分别让它们来修复bug。
让ChatGPT来修bug的方法,就是在对话框里向它提问:
这个代码有什么错误吗?
在第一轮较量过后,结果如下:
从第一轮battle结果来看,ChatGPT修复了19个,CodeX修复了21个,CoCoNut修复了19个,Standard APR则是7个。
而且研究人员还发现,ChatGPT的答案与CodeX最为相似;这是因为它俩是来自同一个语言模型家族。
这时候就会有小伙伴要问了,“ChatGPT不是还没有CodeX厉害吗”。
别急,不要忘了,ChatGPT的一个特点就是越问越“上道”。
例如在这个基准集中,有一个叫bitcount的问题,ChatGPT在刚才第一轮修复过程中是给了错误的答案:
原本ChatGPT应该将第7行的 n ^ = n - 1 改为 n & = n - 1。
但在第一轮中它的回答是:
如果没有更多关于预期行为和导致问题的输入信息,我无法判断程序是否存在错误。
于是在给予它更多信息之后,ChatGPT便答对了这个问题。
以此类推,在对第一轮没答对的问题进行更多信息提示之后,ChatGPT的修bug能力有了大幅提高:
最终,ChatGPT在QuixBugs的40个问题里答对了31个。
网友忧喜参半
对于这样的实验结果,网友们对ChatGPT修bug拿下SOTA这事产生的态度却不太一样。
有网友认为这事不应该让程序员感到危机,而是会让他们觉得开心才对。
言外之意,便是程序员们有了这么好用的工具,干活儿就会变得事半功倍。
不过也有人对此给出了不一样的看法:
工作变得简单,不也就意味着需要的人力更少了吗?
但还网友觉得,活儿是干不完的:
即使AI能把开发时间缩短一个数量级,也只是意味着程序员将更快处理下一个工作。
整体来看,ChatGPT很会修bug,并不会给程序员带来什么致命伤害。
但若是把目光放到OpenAI其他的行动中呢?
全球招外包训练ChatGPT写代码
在此之前,OpenAI就表示过ChatGPT的重要用途之一是帮助程序员检查代码。
换言之,它被定位可用的辅助工具。
相比“ChatGPT带来威胁”的看法,等ChatGPT能力彻底进化,程序员都不用再怕写bug了。
OpenAI布局的棋盘上,可不只有改bug偷塔程序员岗位这一件事。
为了让它更大更强,OpenAI被曝在拉美和东欧等地区,提供了1000个外包岗位。
外包员工的主要工作是标注数据,以及训练ChatGPT写代码
这1000人中,40%是程序员,他们为OpenAI的模型创建数据,用来学习软件工程任务。
一直以来,OpenAI的训练数据是从GitHub上抓取的。
现在外包程序员们新手搓的数据集,不仅包括代码行,还包括代码行背后的人类思考逻辑步骤。
有位南美的软件开发人员爆料,他为OpenAI完成了五小时的无偿编码测试。
整个过程中,他的任务分为两部分。
用书面英语解释如何处理一个编码问题;
提供解决方案。
如果发现bug,OpenAI会向他详细询问bug的具体情况,并请教如何修正。
程序员需要展示思考问题的每个步骤,他据此猜测OpenAI很可能想为ChatGPT提供非常具体的训练数据。
特斯拉前AI主管Andrej Karpathy在推特上调侃:
最新的热门编程语言是英语。
不过话说回来,ChatGPT修bug能力强是好事,要真能搞进化到可以完成代码里死记硬背的部分,也是好事。
毕竟OpenAI成立时对外宣称的宗旨,就是希望“确保通用人工智能可以造福全人类”。
虽然乍一看它这些年做的事,有点像在致力于用一部分人的努力,让更多人失业。
从Dota2赛场上碾压人类,到GPT-3、DALL-E2、ChatGPT的闪耀表现,它带来的新产品总是伴随着“快要让xxx失业了”的议论声。
但无论如何,商业却一直对它青睐有加。
就目前而言,OpenAI的主要商业模式是API费用、token费用和软件许可。
OpenAI近期还发布了ChatGPT的付费版ChatGPT Pro,每月费用42美元(约合285元人民币)。
虽然机器人对话初创公司如雨后春笋般冒出,但诸多迹象表明市场对OpenAI的持续看好。
微软刚刚宣布将向OpenAI加码投资数十亿美元,并将OpenAI的模型融入微软必应等消费级和企业级产品中。
根据知情人士透露,此次追加投资数额约为100亿美元。
与此同时,WSJ披露的消息显示,1月初,亿万富翁Peter Thiel创立的风投基金Founders Fund正在就投资OpenAI进行谈判。
据悉,融资金额将至少达3亿美元。
One More Thing
在第一轮实验中,ChatGPT并没有解决QuixBugs数据集的bitcount问题。
但若是你现在再重头问一次这个问题,就会发现ChatGPT可以“一遍过”:
那么这是否意味着ChatGPT已经从这次研究过程中学会求解了呢?


END

官方站点:www.linuxprobe.com

Linux命令大全:www.linuxcool.com

刘遄老师QQ:5604241

Linux技术交流群:3762708

(新群,火热加群中……)

想要学习Linux系统的读者可以点击"阅读原文"按钮来了解书籍《Linux就该这么学》,同时也非常适合专业的运维人员阅读,成为辅助您工作的高价值工具书!


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
把代码贴进去自动找bug,这个debug神器自动修复仅需几秒,还有GPT-3在线解惑设计师编辑成ChatGPT用户主力!程序员仅占4.4%巴黎,巴黎(8)2022年全球程序员收入报告出炉:国内程序员人均56w年薪。。网友说:我拖后腿了!设计师编辑成 ChatGPT 用户主力!程序员仅占 4.4%我要吐槽邮轮,常在河边走终于湿鞋了。两个小孩相继中了stomach bug,吐一天,拉一天,估计以后再也不坐邮轮了程序员危!传OpenAI全球招外包大军,手把手训练ChatGPT取代码农程序员浅用ChatGPT:替代还很远ChatGPT偷家:Stack Overflow正被程序员抛弃,访问量一个月骤降3200WAI声呐眼镜来了!读懂唇语、隔空操控手机,准确率达95%【机票Bug】国泰直飞 美国回国机票Bug?PK chatgpt 的诗评准确率达86%!谷歌前工程师惊人预测:人类8年内可获永生!绝症不再有ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇大危机!New grad程序员惨遭ChatGPT替代!程序员不香啦?人工智能 ChatGPT 大火!这10种工作最易被取代!今年最赚钱的工作是这些chatgpt 说顾城剽窃2022我飞越三洲(3)华盛顿DC宝藏多多GPT-3解数学题准确率升至92.5%!微软提出MathPrompter,无需微调即可打造「理科」语言模型集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布ChatGPT修bug横扫全场!准确率达78%!网友:程序员要开心了ChatGPT能取代多少程序员?日本啊,日本(十一)利休之死ChatGPT 修 bug 横扫全场,准确率达 78%!网友:程序员要开心了ChatGPT会让程序员大量失业吗?他的未来在哪里?GPT-4来了!直接升级ChatGPT,准确性大大提高,可识别图像信息 | 环球科学要闻ChatGPT带火AI芯片,赚翻了的英伟达发布新核弹:ChatGPT专用GPU,让推理提速10倍!数百程序员专门教AI写代码、40个bug能修复31个,“取代程序员”这次要成真了?中国已恢复和58个国家通航,预计3月底航班大规模增加/空前冬季大风暴即将横扫全美,CNN建议囤粮!/港大全面封杀ChatGPT巴黎,巴黎(9)中国新冠为什么这么多人发烧?ChatGPT修bug横扫全场,准确率达78%!程序员该开心还是难过?因为 ChatGPT,未来十年中国会新增五亿程序员热议!ChatGPT的出现会不会导致底层程序员失业?骚操作!!程序员同时应聘十几个工作,靠裁员补偿年入千万ChatGPT通过谷歌程序员面试,薪资达18.3万美元!ChatGPT通过谷歌程序员面试,薪资达18.3万美元!百度版ChatGPT确定为“文心一言”/ 戴尔裁员5%/ 苹果要开会应对ChatGPT…今日更多新鲜事在此chatGPT. 一本正经胡说八道英特尔GPU大牛投身AI创业/ ChatGPT公布Bug原因/ SpaceX最新估值1400亿美元…今日更多新鲜事在此Chatgpt 4 要release 了
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。