Redian新闻
>
OpenAI官方推出AI生成内容识别器,但成功率只有26%,网友:还不如论文查重工具

OpenAI官方推出AI生成内容识别器,但成功率只有26%,网友:还不如论文查重工具

公众号新闻
机器之心报道
编辑:泽南、杜伟
识别 ChatGPT 生成的内容,OpenAI 亲自上阵了。

很多人也许已经忘记,ChatGPT 正式发布时间是去年 11 月底,到现在才刚刚两个月,但它掀起的热潮却已引发科技公司纷纷跟进,催生了独角兽创业公司,还让学术界修改了论文接收的要求。

在 ChatGPT 引发 AI 领域「是否要禁用」大讨论之后,OpenAI 的真假鉴别工具终于来了。

1 月 31 日,OpenAI 官宣了区分人类作品和 AI 生成文本的识别工具上线,该技术旨在识别自家的 ChatGPT、GPT-3 等模型生成的内容。然而分类器目前看起来准确性堪忧:OpenAI 在博客里指出 AI 识别 AI 高置信度正确率约为 26%。但该机构认为,当它与其他方法结合使用时,可以有助于防止 AI 文本生成器被滥用。

「我们提出分类器的目的是帮助减少人工智能生成的文本造成的混淆。然而它仍然有一些局限性,因此它应该被用作其他确定文本来源方法的补充,而不是作为主要的决策工具,」OpenAI 发言人通过电子邮件对媒体介绍道。「我们正通过这个初始分类器获取有关此类工具是否有用的反馈,并希望在未来分享改进的方法。」

最近科技领域随着围绕生成式 AI,尤其是文本生成 AI 的热情正在不断增长,但相对的是人们对于滥用的担忧,批评者呼吁这些工具的创造者应该采取措施减轻其潜在的有害影响。

面对海量的 AI 生成内容,一些行业立刻作出了限制,美国一些最大的学区已禁止在其网络和设备上使用 ChatGPT,担心会影响学生的学习和该工具生成的内容的准确性。包括 Stack Overflow 在内的网站也已禁止用户共享 ChatGPT 生成的内容,称人工智能会让用户在正常的讨论中被无用内容淹没。


这些情况突出了 AI 识别工具的必要性。虽然效果不尽如人意,但 OpenAI AI 文本分类器(OpenAI AI Text Classifier)在架构上实现了和 GPT 系列的对标。它和 ChatGPT 一样是一种语言模型,是根据来自网络的许多公开文本示例进行训练的。与 ChatGPT 不同的是,它经过微调可以预测一段文本由 AI 生成的可能性 —— 不仅来自 ChatGPT,也包括来自任何文本生成 AI 模型的内容。

具体来说,OpenAI 在来自五个不同组织(包括 OpenAI 自己)的 34 个文本生成系统的文本上训练了 AI 文本分类器。这些内容与维基百科中相似(但不完全相同)的人工文本、从 Reddit 上共享的链接中提取的网站以及为 OpenAI 文本生成系统收集的一组「人类演示」配对。

需要注意的是,OpenAI 文本分类器不适用于所有类型的文本。被检测的内容至少需要 1000 个字符,或大约 150 到 250 个单词。它没有论文检测平台那样的查重能力 —— 考虑到文本生成人工智能已被证明会照抄训练集里的「正确答案」,这是一个非常难受的限制。OpenAI 表示,由于其英语前向数据集,它更有可能在儿童或非英语语言书写的文本上出错。

在评估一段给定的文本是否由 AI 生成时,检测器不会正面回答是或否。根据其置信度,它会将文本标记为「非常不可能」由 AI 生成(小于 10% 的可能性)、「不太可能」由 AI 生成(在 10% 到 45% 之间的可能性)、「不清楚它是否是」AI 生成(45% 到 90% 的机会)、「可能」由 AI 生成(90% 到 98% 的机会)或「很有可能」由 AI 生成(超过 98% 的机会)。

看起来和图像识别的 AI 很像,除了准确程度。根据 OpenAI 的说法,分类器错误地将人类编写的文本标记为 AI 编写的文本的概率为 9%。

一番试用之后,效果的确不大行

OpenAI 宣称其 AI 文本分类器的成功率约为 26%,一些网友上手试用之后,发现识别效果果然不行。

知名 ML 和 AI 研究人员 Sebastian Raschka 试用之后,给出了「It does not work」的评价。他使用其 2015 年初版的 Python ML 书籍作为输入文本,结果显示如下。

  • Randy Olson 的 foreword 部分被识别为不清楚是否由 AI 生成(unclear)
  • 他自己的 preface 部分被识别为可能由 AI 生成(possibly AI)
  • 第一章的段落部分被识别为很可能由 AI 生成(likely AI)


Sebastian Raschka 对此表示,这是一个有趣的例子,但自己已经为将来可能因离谱的论文识别结果而受到惩罚的学生感到难过了。

因此他提议,如果要部署这样的模型,请共享一个混淆矩阵。不然如果教育者采用这一模型进行评分,则可能会对现实世界造成伤害。此外还应该增加一些有关误报和漏报的透明度。

此外,Sebastian Raschka 输入了莎士比亚《麦克白》第一页的内容,OpenAI AI 文本分类器给出的结果竟然是很可能由 AI 生成。简直离谱!


还有人上传了 AI 写作工具 Easy-Peasy.AI 创作的内容,结果 OpenAI AI 文本分类器判定为由 AI 生成的可能性非常小。


最后,有人用上了反复翻译大法,把文本让 GPT3 重写一遍,也能骗过识别器。


总结一下的话就是正向识别不准,反向识别出错,也无法识破一些改论文的技巧。看来,起码在 AI 文本内容识别这一领域,OpenAI 还需努力。

参考内容:
https://techcrunch.com/2023/01/31/openai-releases-tool-to-detect-ai-generated-text-including-from-chatgpt/
https://openai.com/blog/chatgpt/


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
拿到互联网大厂offer,清华应届硕士吐槽2万月薪:还不如本科!专家:这是极致的“唯学历论”看了北大灌饼父亲,我顿悟:富养不如穷养,穷养不如安养,安养不如教养《卧龙》登上Steam畅销榜,好评率只有31%,玩家为何不买账?李开复正式下场,要做 AI 2.0 平台;美版权局:ChatGPT 生成内容不受保护;比亚迪智能手表曝光 | 极客早知道年薪20万!? 美国这个加油站开出高薪,网友:还缺人吗娜娜(三)7%vs26%,日本军费增幅是中国3倍,但军力水平还不如印度?ChatGPT引领AIGC!Lehigh最新《AI生成内容》全面综述,44页详述GAN到ChatGPT发展历程硬核观察 #899 OpenAI 发布检测 AI 生成文本的工具Stack Overflow临时禁用ChatGPT生成内容,网友:人类和AI快打起来!4月比赛的CCC,很多人不知道官方推荐三大备考资料!南加大要疯啊!超46000人早申,EA录取率只有5.2%宇宙人(1215期)二级故障,日本H3火箭发射失败;朝宣称成功研制卫星运载火箭大功率引擎;印海军成功试射舰载布拉莫斯超声速导弹纽约大学发offer啦!录取率只有8%多彩班芙行(6)-步道的虐恋9岁男孩得甲流,发烧1天后肺部大片变白!防治流感,这省官方推荐连花清瘟等药物ChatGPT官方鉴别器紧急发布!当代自相矛盾,不想却遭遇群嘲超级麻豆的《俄勒冈州行摄日记》“再见,杨丽萍!”63岁意外上热搜,20年心血尽毁,真相太心酸:还不如……美国二手房签约数狂飙!但成功过户的房子却非常少!房产市场回暖的势头能否延续?美国房产最前线 孙斯陶 2023.02.27COSTCO新发现和经常买的美味食物人类没有足够的高质量语料给AI学了,2026年就用尽,网友:大型人类文本生成项目启动!ChatGPT“克星”:用AI识别AI生成的文本,英语论文阅读笔记都能测出“海洋馆”还没客厅大?游客进去一看,懵了...网友:还不如去海鲜市场量子位:AI生成内容产业展望报告百亿代工厂新宝股份,利润率只有7%丨硬氪 · 小家电法拍房暴增!二手房乌云压顶!但成交依旧低迷麻省理工官方推荐:26个硬核竞赛、29个夏校项目ChatGPT 又遇“克星”!OpenAI 发布全新 AI 内容识别工具,成功率 26%OpenAI推出ChatGPT“克星”,秒辨AI生成文本,但错把莎翁判成AI教育|推娃神器~美国计算机奥赛官方推荐机构, 青少年编程学校KTBYTE, 让孩子在快乐中学习编程!WPP收购北美数字机构Fēnom Digital;凯捷旗下The Works公司公布新任命(广告狂人日报)以色列自驾游(6)- 世界最古老的城市-耶利哥无需投资!2023美国移民局官方推荐最快移民方式简介Stable Diffusion被起诉!结果人类律师水平拉胯,网友:还不如ChatGPT帮他写
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。