Redian新闻
>
用ChatGPT作弊,小心被抓,反剽窃水印技术让学生噩梦提前到来

用ChatGPT作弊,小心被抓,反剽窃水印技术让学生噩梦提前到来

公众号新闻

机器之心报道

机器之心编辑部

利用 ChatGPT 等 AI 模型作弊引发了人们广泛的担忧,而水印正成为解决该问题的一把「利剑」。

近一段时间以来,对话式 AI 模型 ChatGPT 的风头无两。有人用 ChatGPT 写代码、改 bug;还有人用 ChatGPT 写神经网络,做到了一字不改结果很好用。然而,ChatGPT 在学校作业、论文发表等领域引发了人们广泛的担忧,并采取了相应的措施。


1 月初,纽约市教育官员宣布禁止学生在公立学校使用 ChatGPT 的消息引发了争论;人们对 ChatGPT 的担忧已经蔓延到了 AI 学界自身,全球知名机器学习会议之一的 ICML 最近也宣布禁止发表包含由 ChatGPT 和其他类似系统生成内容的论文,以免出现「意外后果」。


针对这些反馈,ChatGPT 的提出者 OpenAI 正在努力开发缓解措施,帮助人们检测由 AI 自动生成的文本。OpenAI CEO Sam Altman 提出将尝试水印技术和其他技术来标记 ChatGPT 生成的内容,但又表示不可能做到完美。


大型语言模型的潜在危害,可通过给模型的输出加水印来缓解,即把信号嵌入到生成的文本中,这些信号对人类来说是不可见的,但算法可以从短范围的 token 中检测到。


本文中,来自马里兰大学的几位研究者针对 ChatGPT 等语言模型输出的水印进行了深入研究。他们提出了一种高效水印框架,水印的嵌入对文本质量的影响忽略不计,可以使用高效的开源算法进行检测,而无需访问语言模型的 API 或参数。此外,本文方法可以检测到比较短的合成文本(少至 25 个 tokens),同时使得人类文本在统计学上不可能被标记为机器生成。



论文地址:https://arxiv.org/pdf/2301.10226v1.pdf

本文中提出的水印具有以下属性:


  • 可以在不了解模型参数或不访问语言模型 API 的情况下通过算法检测,因此即使模型不开源,检测算法也能开源。同时得益于 LLM 不需要加载或运行,检测成本低且速度快;

  • 可以使用标准语言模型生成带水印的文本,无需重新训练;

  • 只从生成文本的连续部分检测到水印,这样当使用生成的一部分创建更大的文档时,水印依然可以检测到;

  • 如果不修改生成 tokens 的很大一部分,则无法删除水印;

  • 对已经检测到的水印计算出严格的统计学置信度。


论文作者:我们有 99.999999999994%信心


马里兰大学副教授、论文作者之一 Tom Goldstein 表示:「OpenAI 正在计划阻止 ChatGPT 用户的一些作弊行为,与此同时,我们通过水印输出的方式来辨别是否由 ChatGPT 生成的内容。在一个具有 1.3B 参数的模型中,一种新的语言模型水印框架在仅 23 个单词中检测出了 LLM 生成的文本,我们有 99.999999999994% 信心检测到。」




有人毫不夸张的表示,这篇论文标志着 LLM 剽窃和反剽窃检查器之间的竞赛已经开始。


该方法的出现,也让网友替学生们捏了一把汗,直呼「振作起来,高中生们!」



在方法介绍部分,首先该研究介绍了一种简单的水印方法(hard blacklist watermark),该水印易于分析、易于检测且难以删除。该方法通过生成禁止出现的 token 黑名单来工作。在检测水印中,生成水印文本需要访问语言模型,而检测水印则不需要。拥有哈希函数和随机数生成器知识的第三方可以为每个 token 重新生成黑名单,并计算违反黑名单规则的次数。



除此以外,该研究还使用了一种称为 soft 水印的检测方法,该算法并没有严格禁止黑名单 token,而是在白名单 token 的对数上增加了一个常数 δ,算法如下:


上述水印算法被设计为公开的,其实该算法也可以在私有模式下运行,使用一个随机密钥,该密钥用来保密并托管在 API 上。如果攻击者不知道用于生成黑名单的密钥,那么攻击者就难以删除水印,因为攻击者不知道哪些 token 被列入黑名单。


研究者表示,该水印检测算法可以公开,使第三方(例如社交媒体平台)能够自行运行,也可以保持私有并在 API 后面运行。


实验


实验使用 OPT-1.3B 模型探索了水印效果。为了模拟各种语言建模场景,该研究从 C4 数据集的子集中随机选择文本进行切片和切块。


图 2(左)显示了各种水印参数组合的水印强度(z 分数)和文本质量(困惑度)之间的权衡。



该研究在表 2 中提供了各种水印参数的错误率表,此外,该研究还在图 4 中的 ROC 图表中扫描了一系列阈值。




更多技术细节请参阅原论文。



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

欢迎戳这里提交新闻线索和高质量文章给我们。
相关阅读
剽窃、作弊,ChatGPT竟偷偷生成了12篇署名论文!Marcus炮轰Ta变成CheatGPT美国大学教授发现学生用ChatGPT作弊?!直言对AI代写感到恐惧......美国大学教授发现学生用ChatGPT作弊?!直言感到恐惧......超89%的学生使用ChatGPT作弊!斯坦福率先打响反击战大火必死!澳洲UNSW学生被教授揭发利用ChatGPT写论文,最终被学校判作弊挂科!成为用AI作弊被抓包第一人紧急提醒!ChatGPT成神器!但这些“ChatGPT”是假的,小心被骗!全澳首例!澳知名大学学生用AI写论文作弊被抓,多地高校“封杀”ChatGPT89%美国大学生竟用ChatGPT写作业!纽约大学教授警告:用AI就是剽窃ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇全澳首例!学生用AI技术写论文作弊被抓!多地高校严抓作弊行为,被抓可能被开除,甚至取消签证!再也不能用ChatGPT写作业了!新算法给AI生成文本加水印,置信度高达99.999999999994%教授抓到学生用ChatGPT 作弊反被惊到:AI比我 95% 的学生写得都要好防止学生使用AI作弊,斯坦福推出DetectGPT反制紧急提醒!这些“ChatGPT”是假的,小心被骗!马斯克AI实验室名字敲定/ Win11任务栏添加ChatGPT搜索/ 沃尔玛限制员工使用ChatGPT…今日更多新鲜事在此全美89%的大学生,都在用ChatGPT“作弊”?集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布英国大学怕作弊禁用ChatGPT?英国或三月飘雪:气象局降温预警又来了!吹爆!ChatGPT作为新晋懂王还能这么玩?湾区人惊呆了网友用国产ChatGPT作图,这画风还真不是一般的牛!重磅!微软发布 ChatGPT 版搜索引擎,用上了比 ChatGPT 更强大的技术ChatGPT带火AI芯片,赚翻了的英伟达发布新核弹:ChatGPT专用GPU,让推理提速10倍!为什么所有GPT-3复现都失败了?使用ChatGPT你应该知道这些ChatGPT可帮学生写作,加州学校打击作弊新技术澳女泰国旅行归来患7年“怪病”!澳洲夫妇泰国游成“一生噩梦”!罪魁祸首竟都是它!用ChatGPT做PPT,太爽了!(附赠3个网站,1分钟做出绝美PPT!)ChatGPT遭港大「封杀」:罪同论文剽窃抄袭,使用须报备过审跟李沐学ChatGPT背后技术:67分钟读透InstructGPT论文ChatGPT 核心技术大起底——InstructGPT:研究人类反馈数据比加大模型规模更重要!警惕!流感季节提前到来 纽约市流感病例单周激增100%纽约病例激增100%!流感季节提前到来,住院人数首超新冠,医院系统濒临崩溃……紧急通告!墨尔本机场本周又面临出行混乱,而澳洲这个可怕的季节竟然已提前到来!英伟达将芯片计算光刻提速40倍,2纳米提前到来?为什么所有公开的对 GPT-3 的复现都失败了?复现和使用 GPT-3/ChatGPT,你所应该知道的为什么ChatGPT这么强?—— 一文读懂ChatGPT原理!ChatGPT到底有多聪明?我测试了ChatGPT的数学能力ChatGPT通过谷歌程序员面试,薪资达18.3万美元!ChatGPT通过谷歌程序员面试,薪资达18.3万美元!华尔街交易员为何不担心ChatGPT抢饭碗?ChatGPT:我预测不了市场百度版ChatGPT确定为“文心一言”/ 戴尔裁员5%/ 苹果要开会应对ChatGPT…今日更多新鲜事在此ChatGPT因访问量激增崩了;抖音否认3月1日上线外卖服务;百度将于3月推出ChatGPT产品丨邦早报
联系我们隐私协议©2023 redian.news
Redian新闻 · 海外热点 · 尽在指尖
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。