Redian新闻
>
ChatGPT论文通过图灵测试:是AI太聪明,还是学界太灌水?

ChatGPT论文通过图灵测试:是AI太聪明,还是学界太灌水?

科学

海归学者发起的公益学术平台

分享信息,整合资源

交流学术,偶尔风月

去年12月的一项实验里,审稿人尝试鉴别出那些混藏在学术文献中的“AI文本”,但是竟然有三分之一的AI论文成功蒙混过关。这使人警惕,AI论文是否会成为论文造假的新工具?另一方面,人们也对同行评议制度的有效性、学术文献的同质性产生了担忧,学界是否是灌水太严重了,才会让AI模仿的门槛如此之低?


*由于近期平台政策调整,公众号不添加星标则不予展示封面图。我们建议您进入知社学术圈公众号主页,在右上角设置下拉列表中(形为“···”)将我们设为星标。这样我们则能更好的将内容作品呈现给您。谢谢您的支持!

图片来源:Tara Winstead



ChatGPT强大的文本生成能力震惊了世界。它甚至能够进行学术写作,产出的很多文献竟然可以鱼目混珠。这一情况让学术出版行业十分警惕。国际光学和光子学学会(SPIE) 出版总监Patrick Franzen表示,由于担忧这种“AI论文”的准确性和道德规范,他和其他期刊的管理人员正在致力于保护学术文献这方净土免受AI论文潮的侵蚀。“自去年11 月以来,我们一直在谈论这一切”,Franzen说。


在ChatGPT风行全球的时候,多家期刊迅速出台了关于以AI参与研究或论文写作的相关规定。Cell和柳叶刀虽然允许投稿人使用AI工具,但作者不能依赖其完成关键任务——比如解释数据或得出结论,并且作者必须如实声明他们是否以及如何使用了AI工具。


Nature则明确规定:任何大型语言模型工具(如ChatGPT)都不能被列为论文作者;作者如在论文写作中使用过AI工具,则应在论文中明确标明。另一顶级期刊Science则完全禁止论文使用ChatGPT生成的文本。因为Science的编辑认为,AI不能对其写作的内容负责。


为什么期刊编辑们对AI论文如此紧张?难道依赖同行评议制度把关论文质量的学术界,难道一篇由AI东拼西凑攒成的文章,竟然有可能突破一个个专业审稿人的图灵测试,在学术界大摇大摆地登堂入室?


答案还真不好说。


当 ChatGPT 全球免费开放后,使用这个AI工具的人堪比过江之鲫,科研工作者也不例外。而不久前的一项研究声称,许多人可能都难以鉴别出AI所写出的学术文献。这项研究由美国西北大学的Catherine Gao等人2022年12月27日发表于预印本平台 bioRxiv ,题为:Comparing scientific abstracts generated by ChatGPT to original abstracts using an artificial intelligence output detector, plagiarism detector, and blinded human reviewers 。


在这项研究中,研究人员将ChatGPT生成的论文摘要交予审稿人盲审。但审稿人只鉴别出了68%的AI论文,换言之,有近三分之一的论文,他们没能识别出来。这些审稿人表示,要区分两者之间的差别并不容易,虽然仍有一些模糊痕迹可以追寻。


这项研究能得出的结论仍十分有限,但仍然令人十分吃惊,并且造成了一点小尴尬。吃惊的点在于,ChatGPT强大的文本生成能力。尴尬的点在于,同行评议在应对AI赝品时,竟然出乎意料的乏力。这一现象似乎指向两种解释:一是同行评议制度失灵了;二是学界论文同质性太过严重,以至于AI东拼西凑再灌水出一篇,人们也难以鉴别。当然,对于学术界来说,两种解释都不怎么积极。


从根本逻辑上讲,现在的ChatGPT只是个预训练语言模型,它只能从已有的训练样本中提取、整合信息,而不能真正地发展出新的知识。而且期刊编辑们认为,使用AI进行写作,准确性其实并不能得到很好的保证。因为,如果AI没有接触到足够的训练样本以给出恰当答案,那么它通常会自己编造一些信息。2022年11 月,科学家专用的大型语言模型 Galactica,在开放几天之后就匆忙下线,因为它虽然接受了学术文献样本的相关训练,但是事实错误仍然比比皆是。2022 年一项对 Sparrow(由 Google 子公司开发的信息检索聊天AI)进行的预印本研究发现,其回复有高达 20% 的比例包含错误。而且,AI会十分偏向于训练样本中包含的科学假设与前提。


除此之外,期刊编辑更担心AI会助长剽窃之风,即使用AI来对论文进行洗稿、降重。这种现象在高校学生群体中尤其猖獗。美国在线课程提供商Study.com对100多名教育工作者和1000多名18岁以上的学生进行了问卷调查,结果发现:超过89%的学生使用ChatGPT来帮助完成家庭作业,53%的学生承认曾用它写论过文。网络上甚至诞生了一个新词来指代这种学术不端行为——“aigiarism”(AI化抄袭)。


正如前文所述,期刊编辑们对这种新式学术不端十分担忧,因此正在积极拟定政策进行应对。而自然而然地,审稿人就会负担起检查或核查作者披露的生成的文本——这些任务会增加本已很繁重的志愿者工作量。Taylor & Francis的学术道德与诚信主管Sabina Alam表示,随着出版界在处理AI论文方面经验的积累,相应处理政策仍有变化空间。


图片来源:Tara Winstead


互联网公司也在积极配合研发相应的AI文本检测工具。OPEN AI在去年12 月表示,他们正在尝试为AI生成的文本添加“水印”。具体而言,他们考虑将AI进行调整,令其输出的文本中具有某种特殊的字符规律,而这种字符段能够被AI探测器鉴别出来,从而所有AI输出的文本都带上了一种“水印”。


此外,上个月斯坦福大学的一个团队也发布了一个探测器 DetectGPT 。它的特殊点在于,它并不需要独立的算法培训。它的工作方法是,首先创建多个随机变体文本,并让AI按照它的喜好程度对这些文本进行排名。由于AI对原始文本和经AI修改后的文本的偏好程度有异。所以DetectGPT可以据此确定文本是否出自AI之手。不过目前DetectGPT仍需进一步改进。


不过,虽然有一些负面的影响,但AI文本生成在辅助学术方面仍然具有巨大的应用潜力。学术出版开发软件商scite.ai的研发科学家Domenic Rosati声称,他们正在开发一种检查器,这种工具能够将AI文本所使用的文献来源进行追溯,以便人们在使用AI进行文本创作时可以比对参考文献进行准确性校对。在这个意义上,我们能够发现AI将以一种更为务实的姿态来扮演学者的文献助手的角色。在涉及到海量科学文献的场景,这类AI工具无疑会起到巨大的帮助。


尤其是,在撰写综述文章一类的学术文献时,或是在一些需要对大量文献资料进行分析的社会学科,AI强大的资料整合、文本生成能力,将会改变不少学术范式,并且会引领这些研究走向一个新的层次。


因此,局部、短期来看,或许AI在学术出版界造成了一定的“麻烦”,但是从全局、长远来看,学界在完全接纳了AI 之后,它必将会充分施展自己的才能,并且成为学术活动中不可或缺的助理角色。科研与人工智能之间只会是合作,而非对抗。

参考文献:
https://www.science.org/content/article/scientists-explore-ai-written-text-journals-hammer-policies


点击下方知社人才广场,查看最新学术招聘


扩展阅读

 

创新并非无迹可寻:九种最容易激发灵感的场景
当课题变成了鸡肋,放手也是一种科学态度
外国“青椒”吐槽:学界“卷”到令人崩溃
本文系网易新闻·网易号“各有态度”特色内容
媒体转载联系授权请看下方

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
心理内耗测试:是什么让你活得这么累?军旅故事原创系列(19)枪说紧急提醒!ChatGPT成神器!但这些“ChatGPT”是假的,小心被骗!反击!Google 版 ChatGPT 首次亮相,有一个功能「碾压」ChatGPT大学生用GPT-3写论文遭重罚,拒不承认!大学论文已「死」,ChatGPT或引发学术圈大地震集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布不只是黑盒测试:测试工程师如何识别和消除代码坏气味?孟晚舟将首次出任华为轮值董事长/ 百度All in类ChatGPT项目/ 知乎因ChatGPT大涨50%…今日更多新鲜事在此ChatGPT到底有多聪明?我测试了ChatGPT的数学能力大表哥走了——一座大山遽然落在头上金融民工会因为ChatGPT下岗吗?刚刚,我问了ChatGPT 24个金融圈灵魂问题朋友圈全是ChatGPT! ChatGPT概念股大火ChatGPT 或导致 20 种工作失业?恐怕远远不止,比尔盖茨 :ChatGPT 将改变世界【双龙喜相逢】齐天龙#1 《天天想你》《时代周刊》年度人物微信回应头像褪色,部分C刊不准隐瞒ChatGPT使用,微软推进裁员,Opera新版集成ChatGPT,这就是今天的其它大新闻!全球都为ChatGPT疯狂,它到底是风口还是虚火?深度解读风暴眼中的ChatGPT | 直播预约跟李沐学ChatGPT背后技术:67分钟读透InstructGPT论文下载量暴增10倍!微软必应集成ChatGPT后需求大爆发;4省份上调最低工资标准;淘宝已屏蔽ChatGPT关键词丨邦早报重磅 | 我内测了微软最新的 ChatGPT 版必应:比 ChatGPT 更像人,但有一个大隐患百度版ChatGPT确定为“文心一言”/ 戴尔裁员5%/ 苹果要开会应对ChatGPT…今日更多新鲜事在此给人类的「图灵测试」来了!你猜,画这些的是人还是AI?ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇ChatGPT带火AI芯片,赚翻了的英伟达发布新核弹:ChatGPT专用GPU,让推理提速10倍!18.3 万美元offer到手!ChatGPT 通过谷歌 L3 面试:留给谷歌的时间不多了ChatGPT 进军 B 端?消息称微软将允许企业创建定制版 ChatGPT圣诞节的温暖故事。。。对谈|ChatGPT:是新世界的诞生,还是人类末日的开始?ChatGPT因访问量激增崩了;抖音否认3月1日上线外卖服务;百度将于3月推出ChatGPT产品丨邦早报华尔街交易员为何不担心ChatGPT抢饭碗?ChatGPT:我预测不了市场ChatGPT在律所:聪明人已经在用ChatGPT吊打同事了!重磅!微软发布 ChatGPT 版搜索引擎,用上了比 ChatGPT 更强大的技术普林斯顿科学家全新「反向图灵测试」:没有「灵智」的AI才会反社会ChatGPT通过谷歌程序员面试,薪资达18.3万美元!ChatGPT通过谷歌程序员面试,薪资达18.3万美元!剽窃、作弊,ChatGPT竟偷偷生成了12篇署名论文!Marcus炮轰Ta变成CheatGPT
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。