Redian新闻
>
GPT-4成学术造假“神器”,伪造数据又快又合理,Nature请统计学专家“断案”

GPT-4成学术造假“神器”,伪造数据又快又合理,Nature请统计学专家“断案”

公众号新闻
萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

学术造假有了GPT-4,变得更容易了。

这两天,一篇刊登在Nature上的新闻表示,GPT-4生成的造假数据集,第一眼还真不一定看得出来。

除非请来业内专家仔细对数据集进行评估,才能发现个中细节的不合理性。

这个新闻的来源是一篇发表在JAMA Ophthalmology上的论文。

论文使用GPT-4为一项医学学术研究生成了一个假数据集,发现它不仅能创造出看似合理的数据,甚至还能用来准确支撑错误的论文观点。

对此,有网友表示十分理解:

大模型最重要的能力就是生成“看似合理的文本”,因此它非常适合干这活儿。

还有网友感慨:技术“有良心”的程度,也就和用它的研究人员一样了。

所以,GPT-4创造的假数据究竟长啥样?

GPT-4学术造假有一手

先来看看GPT-4是怎么生成假数据的。

具体来说,研究人员采用了GPT-4的高级数据分析(ADA,原代码解释器)功能,来生成一个假数据集。

这个过程中,研究人员给GPT-4提供了一些专业知识和统计学要求,让它生成的数据看起来更加“合理”。

第一步,给GPT-4输入一系列数据要求

研究人员先给GPT-4提供了一系列详细的提示词,要求它创建一个关于圆锥角膜(keratoconus)眼部疾病患者的数据集。

圆锥角膜是一种疾病,会导致角膜变薄,导致注意力受损和视力不佳。

目前治疗圆锥角膜疾病的方式主要有两种,一种是穿透性角膜移植(PK),另一种是深板层移植(DALK)。

在没有任何实质性证据的情况下,研究人员让GPT-4捏造一组数据,支撑DALK比PK效果更好的观点。

随后,再设定了一系列统计标准,如要求GPT-4生成的术前和术后数据产生统计学上的显著差异。

第二步,就是生成数据了。

这个过程中可能会由于GPT-4字数限制,导致答案生成暂停,通过“继续”提示就能恢复生成过程。

最终,GPT-4成功生成了包含160名男性和140名女性患者的数据集,并做出了一组支撑DALK比PK效果更好的数据。

由GPT-4生成的假数据集长这样,表格1是关于分类变量的数据,包括患者性别、手术类型、免疫排斥等情况:

表2是关于连续变量,包括术前术后的视力矫正情况等:

论文作者之一Giuseppe Giannaccare博士表示,如果非常快速地查看这个数据集,很难识别出它其实“不是人做的”。

专家审查才能发现

为了验证GPT-4做出来的数据是否真的令人信服,Nature特意请来了英国曼彻斯特大学生物统计学家杰克·威尔金森(Jack Wilkinson)和同事Zewen Lu,来检查数据可信度。

检查结果表明,许多捏造出的患者在性别、名字匹配度上就有问题(例如Mary的性别一栏是男性一样)。

然后,一些数据之间的相关性也不高,包括术前和术后视力测量与眼部成像检查(eye-imaging test)之间的数据相关性等。

最后,患者的年龄也设置得不同寻常。

在检查之后,用GPT-4生成假数据集的研究人员也承认,大模型在生成数据集上还存在有缺陷的地方。

但杰克·威尔金森(Jack Wilkinson)依旧对结果表示了担忧:

一旦知道自己“哪里露馅了”,AI很容易就能纠正它,并生成更加具有说服力的结果。

有网友认为,这篇文章最大的意义并不在于证明“GPT-4有幻觉”;

更重要的是,它证明了GPT-4生成看似合理的数据集“非常容易”,也算是一种对期刊的警告(记得严格审稿!)。

不过,也有网友感觉研究意义不大,因为即使没有ChatGPT这样的工具,真想造假的学者也能很容易伪造出一套数据。

One More Thing

此外,这两天一段关于ChatGPT的视频在抖音上也是火得不行。

视频中,终于毕业的歪果仁小哥直呼“感谢ChatGPT帮助我完成所有作业和考试”(手动狗头)

那么,对于ChatGPT在学术研究上可能带来的问题,你怎么看?

参考链接:
[1]https://jamanetwork.com/journals/jamaophthalmology/article-abstract/2811505

[2]https://www.nature.com/articles/d41586-023-03635-w
[3]https://news.ycombinator.com/item?id=38386547

MEET 2024大会定档!

首批嘉宾阵容公布

量子位「MEET2024智能未来大会」正式定档12月14日!点击报名线下参会

李培根院士、360集团梁志辉、小冰李笛、浪潮刘军、昆仑万维方汉商汤科技王晓刚DeepWay田山、千挂科技廖若雪、潞晨科技尤洋、小米集团栾剑、蚂蚁集团杨铭、星动纪元陈建宇等嘉宾已确认出席。

点击“预约”按钮,一键直达大会直播现场!


点这里👇关注我,记得标星噢

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
叶璇李国庆官宣恋情?网友:“离谱又合理”【事件跟踪】123页PDF实名举报原天津大学张裕卿学术造假后续来了!顶尖211一课题组11位硕士、博士生成员实名联合举报导师学术造假!校方最新回应:存在学术造假晚讯 |华中农业大学11名学生联名举报导师学术造假、北京疾控:流感疫情呈现降势夏婳:两情难相知(十二)女明星走红毯必备“神器”,1秒“吸”走小肚腩,收腹不勒腹、舒适又好穿~文末送书 | 统计至简:知乎数学可视化大神全角度拆解统计学与概率论华中农业大学回应学生举报导师学术造假:存在学术不端行为又快又卷的时代,我家孩子“慢”就有错吗?!百度网盘变了!进化成学习神器:音视频转文稿、加字幕,还能一键生成PPT!微软仅凭「提示工程」让GPT-4成医学专家!超过一众高度微调模型,专业测试准确率首次超90%未央播报 | 统计局正完善青年失业率的统计方法和统计口径 OpenAI暂停新的ChatGPT Plus注册诺奖前夜,Nature发文ChatGPT终极预测!mRNA疫苗能否锁定大奖11名硕士、博士研究生集体实名举报导师学术造假!华中农业大学回应→第十章第四节 海陆空三军和国民警卫队教授被学生举报学术造假,华中农业大学启动调查荡游威尼斯GPT-4 Turbo更强更便宜,GPTs、GPT商店最大亮点,这是OpenAI首个开发者日新研究:ChatGPT可伪造看似合理“支持”科学假说的试验数据;西班牙一设计师打造首个AI模特,最高月入1万欧元丨AIGC日报OpenAI估值860亿美元股票出售重启;ChatGPT科研造假引Nature关注;英伟达用AIGC加速药研丨AIGC大事日报说一个有关Open AI的Chat GPT 创投人和我家的小故事【考前必做】11月CFA考前冲刺“神器”,你竟然还没做?!年终总结用这25套PPT模板,半小时就能做得又快又好!本年度最离谱又合理的cpOpenAI推出在线商店GPT Store;骗子用AI合成泰勒·斯威夫特声音,伪造“厨具免费送”广告行骗丨AIGC日报诺奖前夜,Nature发布ChatGPT终极预测!mRNA疫苗能否锁定大奖?时间的湾 1GPT turbo 看了没?!这真是大批失业人员在路上。丑闻曝光!53页ppt举报造假违规入读博士,三名导师替代完成学业…ChatGPT的学术造假能力已经达“专业水准”板栗如何去壳去皮又快又好?分享8个小妙招,总有一个适合你!现场直击OpenAI开发者大会:GPT-4 Turbo、用户自定义GPT、GPT商店,一切都是硅谷新王的架势【突发】险资再出手,10倍PE合理,3倍PE也合理吗?唯老是尊——中国养老现状及探讨(一)11名研究生联合举报导师学术造假:总要有人做很蠢但正确的事chat gpt 怎么上不去了? 彻底罢工了123页PDF实名举报原天津大学张裕卿学术造假后续来了:被撤稿3篇及被通报绝!被爆疑似学术造假,没想到博士本人竟发帖回应:为了毕业,拼了!(免费学ChatGPT)回国大开眼界,这些东西你吃过吗?(图)
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。