Redian新闻
>
用 AI 对抗 AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本

用 AI 对抗 AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本

公众号新闻
作者 | 凌敏
近日,斯坦福大学研究团队提出了一种名为DetectGPT的新方法,旨在成为首批打击高等教育中LLM生成文本的工具之一。

过去两个月,ChatGPT 火爆全网,写代码、编故事、构建虚拟机……ChatGPT 几乎无所不能。在“硬币的另一面”,有学生开始用 ChatGPT写作业、写论文。根据最新研究,学者们也可能会被 ChatGPT 欺骗,误以为 ChatGPT 生成的 虚假科学摘要 来自顶级研究期刊上发表的真实医学论文。

近日,斯坦福大学研究团队提出了一种名为 DetectGPT 的新方法,旨在成为首批打击高等教育中 LLM 生成文本的工具之一。相关研究论文已发表在预印本网站 arXiv 上。据悉,这是一种使用模型的对数概率函数的局部曲率检测预训练大型语言模型样本的方法,该方法或对检测验证产业带来积极影响。

该方法基于的原理是:由大型语言模型生成的文本通常在模型的对数概率函数的负曲率区域的特定区域徘徊。通过这个发现,该团队开发了一种新的指标,用于判断文本是否是机器生成的,并且不需要训练人工智能或收集大型数据集来比较文本。

研究人员表示,随着大型语言模型 (LLMs) 的流畅性和知识积累程度不断增强,人们对于检测一段文本是否由机器编写的需求日益旺盛。比如,一些学生使用大型语言模型来完成书面作业,以至于教师无法准确地评估学生的学习情况。

研究人员首先证明了从大型语言模型中采样的文本倾向于占据模型的对数概率函数的负曲率区域。利用这一观察结果,定义了一个新的基于曲率的标准,用于判断是否从给定的 LLM 生成通道。这种方法即为 DetectGPT——不需要训练单独的分类器,不需要收集真实或生成的段落的数据集,也不需要显式地为生成的文本加水印,它只使用由感兴趣的模型计算的对数概率,和来自另一个通用预训练语言模型 (例如 T5) 的文章随机扰动。

研究发现 DetectGPT 比现有的零帧模型样本检测方法更具鉴别性,显著提高了 20B 参数 GPT-NeoX 生成的假新闻文章的检测能力,从最强零帧基线的 0.81 AUROC 提高到 DetectGPT 的 0.95 AUROC。

然而,这一方法也存在一定的局限性。例如,如果现有的掩模填充模型不能很好地表示有意义的改写空间,则某些域的性能可能会降低,从而降低曲率估计的质量;DetectGPT 相比其他检测方法需要更大的计算量等。

你也「在看」吗? 👇


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
炸了!斯坦福新研究:ChatGPT背后模型被证实具有人类心智!知名学者:“这一天终于来了”留学生哭了!22岁多伦多华裔学霸自创神器:专门检测论文真实性!chatgpt 说顾城剽窃造娃养娃,才知道有这特殊医疗保险-美洋插队生活实录(十六)300美元平替ChatGPT!斯坦福130亿参数「小羊驼」诞生,暴杀「草泥马」ChatGPT火出圈!斯坦福&宾大学霸揭秘美本STEM申请如何破局?chatGPT. 一本正经胡说八道新冠终结者来了?斯坦福研发最新疫苗:比mRNA强百倍,覆盖所有毒株!ChatGPT“克星”:用AI识别AI生成的文本,英语论文阅读笔记都能测出冒充人类作者,ChatGPT等滥用引担忧,一文综述AI生成文本检测方法厉害了我的 ChatGPT, 弱惊了!斯坦福大学研究表明:美本申请文书比起SAT,更能暴露你的家庭出身ChatGPT 核心技术大起底——InstructGPT:研究人类反馈数据比加大模型规模更重要!新冠终结者来了?斯坦福研发最新疫苗覆盖所有毒株!背后是扎克伯格…立足工农大众的新秧歌运动掀起巴西队回家了!ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇面对电车难题,ChatGPT的回答会影响人类的道德判断,引发研究人员担忧RRC detection、CornerNet、M2Det、FOCS…你都掌握了吗?一文总结目标检测必备经典模型(三)新冠终结者来了! 斯坦福研发最新疫.苗秒杀所有变异! 小扎转发!美国被「XBB毒株」攻占!新冠终结者来了?!斯坦福研发最新疫苗:比mRNA强100倍,覆盖所有已知变异毒株斯坦福5.5万人研究:30年,男人长(cháng)了3厘米,但并非好事PK chatgpt 的诗评新冠终结者来了!斯坦福研发最新疫苗秒杀所有变异!小扎转发!新冠将被终结?斯坦福研发最新疫苗:比mRNA强百倍,覆盖所有毒株!牛人!22岁多伦多华裔学霸自创神器:专门检测论文真实性!不为赚钱只为助人...Chatgpt 4 要release 了微软再扔AI聊天画图炸弹!视觉模型加持ChatGPT,Visual ChatGPT横空出世因ChatGPT爆红的文本生成大模型新冠终结者来了?斯坦福研发最新疫苗:比mRNA强百倍,小扎转发!超89%的学生使用ChatGPT作弊!斯坦福率先打响反击战新冠终结!?斯坦福研发新疫苗秒杀所有变种!产生强效持久抗体!婴幼儿也能用!防止学生使用AI作弊,斯坦福推出DetectGPT反制新冠终结者来了?!斯坦福研发最新疫苗,直接秒杀所有已知变异毒株……新冠终结者来了?斯坦福研发最新疫苗,直接秒杀所有已知变异毒株……OpenAI推出ChatGPT“克星”,秒辨AI生成文本,但错把莎翁判成AI军旅故事原创系列(11)看电影的灰色地带不会PS没关系,AI拼图技术已能以假乱真|斯坦福研究新冠终结者来了?斯坦福研发最新疫苗:比mRNA强百倍,覆盖所有毒株,小扎转发!面对道德绑架
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。