Redian新闻
>
AI那么牛了,来挑战一下同行评议会怎样?

AI那么牛了,来挑战一下同行评议会怎样?

教育
海归学者发起的公益学术平台
分享信息,整合资源
交流学术,偶尔风月

AI技术的快速发展无疑是近几年最值得关注的科技进步,由于它的通用性,人们似乎在尝试所有可能应用它来减少人类劳动的场景,画画、写作、语音识别、自动写代码……在科学界,AI工具也在抄袭检查、图像检查、文献翻译等方面有了很大的进步,相关工具正在越来越好用。那么,如果让AI来挑战一下学术界最繁忙、最困难的工作之一:同行评议,结果会如何呢?


图源:scholarlykitchen.sspnet.org


学界人士对于同行评议的态度肯定是一言难尽的,究其原因,无非是因为它十分的不完美,问题多如牛毛,但是又确实无法摆脱,作为目前学术界最主要的研究质量控制机制,有它存在,学术界至少能维持最低限度的交流效率和信任基础。但是这项大规模应用已经超过半个世纪的不成文的规矩,面临的问题也确实很多,最突出的矛盾有:

效率问题:
全球每年发布的论文近年来呈指数型增长,2020年已经超过了700万篇,巨大的发稿量带来了巨大的评审需求,而评审员们虽然已经非常努力了,每年审查220万篇论文,工作时长加起来有一万五千年,很多审稿人抱怨大量的审稿请求让他们疲于奔命,但是依然会被抱怨审稿周期太长,耽误发表。原因之一当然是审稿这项工作提供的激励太少了,很多人更喜欢发文而不是审查别人的工作,审稿人的增加量远远无法匹配新手稿的提交量。

图源:Michael Fire 和 Carlos Gusterin


质量问题:
太多号称经过同样评议的论文存在许多明显的错误甚至是欺诈行为,没有能将这样的论文剔除出去反而用评议程序为其增加了可信度,这是同行评议最为人诟病的问题之一。研究者指出很多审稿人主要关注研究过程的核心部分,对于构成这些论文的基础但是“比较无聊”的部分则不太关注,数据、图像、抄袭以及其他明显的问题常常会被忽略,导致整个评审过程毫无意义——从一开始论文的基础就不存在。但是大部分类似的问题被揭露出来往往是在论文发表之后,因此人们只能对新论文持保留态度。

等等,这些不是真正的误差线…作者只是把字母“T”放在条形图的上方

来源:twitter@SeriFeliciano


公平性问题:
由于主观看法的存在,同一篇稿件获得不同的审稿意见很正常,但是差别过大则会让作者感到无所适从。那些知名学者的文章总是会获得更多的认可,而非英语母语的作者则会受到更多的批评。同时学术出版绑定了太多现实利益,类似“联合审稿人”、“幽灵审稿人”甚至是“自我审稿人”等操纵审稿过程的问题从未消失,也不会消失。

所有这些问题的根源似乎都指向了人类的局限性:人会累,人会犯错,人会有私心,幸运的是,AI不会。

图源:researchprofessionalnews.com

独立学者Haseeb Irfanullah 认为,虽然很明显AI目前肯定无法全面取代人工审稿,但是他认为可以根据不同的部分、流程,逐步扩大AI审稿的范围,至少能帮助编辑发现那些基础的错误,如投稿是否符合期刊的关注领域,论文结构是否完整,抄袭检查,研究数据和伦理审查是否符合基本规定,图像是否有重复、篡改或者“误用”等等。很多AI工具已经在不同程度的辅助人类进行上述工作,现在要做的是将它们整合起来,从而成为一个强有力的通用性审稿AI,负责对巨量的论文手稿进行初审,通过后才交给人工审稿员进行更进一步的审查。

同时这个过程应该尽量避免AI的“黑箱”效应:很多工具现在直接给出结果,但是人们不知道它是怎么做到的。AI审稿应该能够给出具体的问题清单,以便人们可以一一对照反馈从而不断提高它的水平和准确度。虽然一种工具的局限性完全可以预料,但是除了ChatGPT,还有很多AI语言工具都在开发中,出版商完全可以应用几种不同技术路线的工具来综合判断,就像不同的审稿人可能给出不同的审稿意见一样,避免数据偏见和漏洞式错误。

虽然大语言模型的原理同AlphaFold预测蛋白质结构、AlphaGo下围棋的原理并不相同,但是显而易见的是后面这两个工具确实做到了人类目前完全做不到的事情,而根据AI在许多其他领域的表现和业界的投入强度,期待通用性的AI审稿人的出现绝非痴人说梦。

而如果真的出现了符合一定标准的AI工具,前文提到的关于同行评议的几个问题则可以得到很大程度的缓解:

  • AI不需要休息,可以7×24小时工作,审稿速度是人类的上千倍,所有的论文都可以经过AI的审查,包括预印本、会议论文和期刊通信等目前不在评审范围的文章;

  • AI可以严格执行所有的完整性审查,不存在忽略与否的问题,大量基本结构有缺陷的论文可以快速被驳回,从而大量节省人类审稿员的宝贵工作时间,同时对提高论文的可重复性也会有很大帮助

  • 更重要的是公平性:AI可以无视作者的任何信息,不管是新人博士还是诺奖得主,新晋讲师还是大学校长,都能做到一视同仁,这种匿名性也最大程度的减少了审稿过程被操纵的可能:想磕头都找不到庙门。LLM本身具备的多语言功能甚至可以大量审查非英语论文,对于提高非英语母语科学家的竞争力有很大的意义。


对此,您怎么看呢?不妨留言与大家分享。


附录:部分AI工具清单


  • 提交工具:Rex
https://www.wiley.com/en-us/network/publishing/research-publishing/editors/introducing-research-exchange-rex
  • 书写工具:PaperPal, Writefull
https://paperpal.com/
https://www.writefull.com/
  • 引文背景:AI
https://scite.ai/
  • 抄袭检查:Similarity Check, STM efforts
https://www.crossref.org/services/similarity-check/
https://www.stm-assoc.org/standards-technology/working-group-on-image-alterations-and-duplications/
  • 检查可重现元素:Penelope,SciScore,Ripeta
https://www.penelope.ai/precheck
https://www.sciscore.com/
https://ripeta.com/
  • 总结:Scholarcy
https://www.scholarcy.com/
  • 图形检查:Content Authenticity Initiative, Proofig, ImageTwin
https://contentauthenticity.org/
https://www.proofig.com/
https://imagetwin.ai/
  • 检查计算生成的论文:Dagpap
https://sdproc.org/2022/sharedtasks.html#dagpap
  • COPE 道德出版指南:
    https://publicationethics.org/
参考文献:
1.https://scholarlykitchen.sspnet.org/2023/10/12/the-peer-review-renaissance-an-urgent-call-for-transformation/
2.https://scholarlykitchen.sspnet.org/2023/09/29/ending-human-dependent-peer-review/
3.https://www.insidehighered.com/news/tech-innovation/artificial-intelligence/2023/10/24/ai-can-lessen-peer-review-woes-researchers


点击下方知社人才广场,查看最新学术招聘

扩展阅读

 

美国学者:同行评议失败已成定局,应全盘抛弃!
科睿唯安引入AI评估期刊质量,将持续淘汰学术不端期刊
ChatGPT代写论文?AI对学术出版的“渗透”远比你知道的更多
AI在科研中的渗透率,1600名科学家这样说
本文系网易新闻·网易号“各有态度”特色内容
媒体转载联系授权请看下方

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
若赖清德赢,大陆怎么办?若侯友宜逆袭,又会怎样?前任首富身家缩水约500亿元,奢侈品房东迎来挑战|氪金 · 大事件房地产专家预测:2024年湾区住房市场会怎样?助学金评议,我们与公平的距离挑战一张封神! 加拿大的秋天怎能没有枫叶?Hooli万圣节惊魂夜活动!全美七大玉米地鬼屋之一,你敢来挑战吗?香港房价暴跌回7年前,内地房价会怎样?感谢杀死巴勒斯坦儿童?假如我们全都沉默,世界会怎么样?联合办公鼻祖WeWork要破产了?新加坡的14个共享办公空间会怎样?与家人游览杭州西湖当全球人口达峰后,会怎样?宇宙会怎样结束? | 赠书费城议会否决市长为娱乐性大麻销售打开大门的企图|一名婴儿死亡,水珠玩具召回|费城居民议会厅内反对拟建的76人队体育馆建设爱因斯坦的相对论那么牛,为啥没得诺贝尔奖?苹果折叠产品再曝:已进行评估、或即将到来如果人人都活到120岁,世界会怎样?| 商论推出《长命百岁》专题耶鲁大学高含金量夏校YYGS启动申请,等你来挑战!报税是个坑?在美国,不报税会怎么样?没有”劳务派遣“的人力资源服务业,2024年后将会怎样?蚊子叮到我大动脉上会怎样?伏尸一人,血流五步?6008 血壮山河之随枣会战 南昌之战 1大叔中五千万刀乐透,仍坚持凌晨4点上班:不能扔下同事不管!2024年加拿大经济会怎样?太烧脑!有史以来最疯狂的20道牛津剑桥面试题,来挑战思维极限!第七章第四节 宗教旧文化在欧洲的衰落别再使用 RestTemplate了,来了解一下官方推荐的 WebClient !新众院议长终出炉 曲折背景与未来挑战一次看当妈这么苦,躺平一下会怎么样?假如阿根廷闯过这一关,世界将会怎样全天候战略伙伴关系---委内瑞拉TGS上的二次元:日韩合作,卖相尚佳,又有新游戏来挑战原神了?旅美散记(12):幼儿不知甜滋味如果没有白酒板块,这十年的市场表现会怎样?今日神图 | 如果把诗中的“马”换成“狗”,会怎么样?牛人!纽约男挑战一天吃完22家米其林餐厅,整整研究了4个月。
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。