AI绘图技术,会加剧学术不端吗?
该图片由Arek Socha在Pixabay上发布
李研 | 撰文
2023年是特殊的一年。如果未来人类回顾历史,那么从这一年起,他们就需要开始甄别哪些艺术作品来自于人类的真实创作,而哪些是人工智能(AI)生成的。
伴随着ChatGPT对文字创作产生的颠覆性影响, AI技术在绘图领域也开始崭露头角。过去,人们需要耗费大量时间与成本去学习绘画技能并熟悉制图工具,再加上一点艺术天赋,才能创作出美轮美奂的作品。但现在,只需要简短的一两行文字提示,就能轻松生成一张符合需求的高质量原创图片,大大降低了绘图的门槛。
例如,笔者在过去两周就利用一款“AI作画”的微信小程序,根据父亲节和端午节分别生成了两张图像。虽然图片在细节上有很多瑕疵,但整体氛围充满爱意,紧扣节日主题。值得一提的是,父亲节图片中,必须在提示语中强调是“一位中国父亲带着他的孩子在城市公园里骑车”,否则出现的就是外国父亲和外国街景。然而,想必是AI知道端午是中国特有的节日,只需简单提示“端午节一家人吃粽子”,AI就能生成我们熟悉的画风,而且还是目前主流媒体中常表现的四口之家。
常言道,“巧妇难为无米之炊”。如今AI绘图的横空出世,让许多不懂绘画的人都能做出”无米之炊”,也能给专业人士带来了新的设计灵感。
然而,作为一种颠覆性的技术变革,AI绘图的“双刃剑”特征十分明显。当我们在欣赏高质量的AI虚拟图片时,也不免会担忧其被某些别有用心之人利用、篡改,作为新闻和证据发布,对社会的稳定和公正造成潜在的风险。
作为学术期刊的编辑,笔者对AI能否生成可用于学术出版的科学图像特别感兴趣。学术圈里的人都知道,论文中的图片(例如电镜、显微镜的图像以及电泳照片等),是研究结论的重要支撑,必须能够反映真实的实验结果。学术期刊一般只能允许作者在不损害图像关键信息的前提下,对亮度、颜色和对比度等参数作适当的优化,但图片编辑必须基于原始素材,绝不允许无中生有。
那么,AI绘图能生成以假乱真的科学实验图片吗?笔者试着用手机上的小程序生成虚拟荧光显微镜和扫描电子显微镜 (SEM)的图片。这里顺便解释一下,这两种显微镜技术都是科学实验中观测物质微观结构的常用方法,在几乎每篇有关材料科学的论文中都能看到。
如下图所示,尽管AI技术生成的虚拟图像中展示的形貌有些奇特,但整体看来并非离谱。显然,AI很清楚荧光显微镜拍摄的图像是彩色照片,而SEM的原始图像应是黑白的,而且AI似乎还明白它们的功能是用来观察微观物质的细微结构。无论是颜色搭配还是明暗对比,虚拟图片也符合常规荧光显微镜和SEM图片的基本特征。
AI可用于生成虚假实验照片的问题已经开始引起学界警惕。就在今年6月,来自美国西太平洋实验室(Pacific Northwest National Laboratory)的两位学者在Cell Press旗下的Matter期刊发表了一篇题为“Preventative studies should begin now for detecting AI-generated microscopy images”的文章。
在文中,作者通过当前流行的AI绘图平台DALL·E 2,模拟SEM的图像。这些虚假图片具备真实SEM图像中常见的纳米纹理表面或类似于生物矿化材料特征的复杂形貌。文章特别指出,AI 还成功模拟出了常会分布在整个SEM图片中的背景噪声,从而使虚拟照片显得更加逼真。
需指出,无论是笔者还是Matter文章的作者,所使用的软件都是面向大众的常规AI绘图程序。考虑到目前AI绘图技术还处于快速发展阶段,且可以从已发表的学术论文中获取海量的电镜照片,以现在AI强大的学习能力,如果辅以更有针对性的模拟训练,则完全有可能生成更为精细且能够满足特定需求的SEM图像。
这无疑为屡禁不止的“论文工厂(paper mill)“带来了可乘之机。造假之人可以利用专业AI绘图程序,为不存在的“样本”快速生成逼真的科学图像。
更为严重的是,目前学术界和出版界对这种未来极可能出现的欺诈行为还缺少应对的措施。以笔者所工作的期刊为例,尽管出版社在文字查重和图片检查两方面都引入了先进的专业软件并投入了可观的成本,但所针对的手段还主要停留在“copy-paste”和“photoshop”这类“前AI时代”的学术不端操作。而AI虚假图片如果出现,它很可能会逃避现有的欺诈检查。
Matter 文章作者在文末提出,面对AI虚拟图片技术的冲击,我们应尽快开发出相应的侦测方法,为这种潜在的学术不端行为提早做好准备。而在笔者看来,“道高一尺,魔高一丈“,使用技术手段或训练专业人员去审核检测,固然对防范这种新型欺诈有所帮助,但无疑会拉高出版成本,也难以杜绝更先进的造假技术出现。
除了技术手段的提升,我们更需要多管齐下,同时加强科研诚信的管理,以及鼓励数据的开放共享,以增进科研的透明度和可复现性。
在与国内一位电镜专家交流时,笔者获知现在的各种电镜和显微镜,在产生图片数据的同时,也有同步存储原始数据的功能。这些原始数据文件就记录了实验中多方面的信息,例如观测时间,操作模式和电镜的状态等。这些信息是AI无法仿造的。在提交论文的同时,提交记录原始数据或算法的文档,将是对造假者有力的震慑。
目前,一些知名学术出版商和期刊已经在鼓励作者将电镜的原始观测数据上传至开放获取平台(例如Mendeley Data),将来如果AI虚拟照片问题真成为一种严重威胁,那么不排除此举会成为作者投稿时的一项必须操作。出版商也将紧密关注AI技术的发展,制定相应的规则实践,以维护学术出版的严肃性。
总之,人工智能可以让我们的生活更加美好、工作更加高效,但也可能变为欺诈工具,为科研诚信带来新的挑战。何去何从?这并不由AI决定,而取决于人。
欢迎关注我们,投稿、授权等请联系
微信扫码关注该文公众号作者