Redian新闻
>
今晚直播 | 上海财经大学博士生蔡树阳:通过单个空格逃避ChatGPT检测器

今晚直播 | 上海财经大学博士生蔡树阳:通过单个空格逃避ChatGPT检测器

公众号新闻





 学术直播间 第 4 期 


论文原作解读✔️

在线实时Q&A✔️


 直播主题 


通过单个空格逃避ChatGPT检测器

 直播嘉宾 


蔡树阳
上海财经大学在读博士生

 直播时间 


2023年9月12日(周二)
19:00-19:30

 观看方式 


扫码下方二维码

进入直播间观看



 报告介绍 


ChatGPT带来了革命性的社会价值,但同时也引发了人们对人工智能生成内容被滥用的担忧。因此,一个重要的问题是如何有效检测内容是由ChatGPT生成还是人类生成的。现有的检测方法建立在这样一个假设之上,即人工智能生成的内容和人类生成的内容之间存在着分布差异。这些差异通常是通过统计信息或分类器来识别的。


我们的研究挑战了检测器中的分布差异假设。我们发现检测器并不能有效地区分人类生成和人工智能生成内容之间的语义和风格差距。相反,“微小的差异”,比如“额外的空格”,变得对于检测至关重要。基于这一发现,我们提出了“SpaceInfi”策略来逃避检测。实验证明了这一策略在多个基准和检测器上的有效性。我们还对为什么“SpaceInfi”能成功逃避基于困惑度的检测提供了理论解释。我们的发现为理解和构建更实用的ChatGPT检测器提供了新的见解和挑战。



 嘉宾介绍 


蔡树阳

上海财经大学在读博士生


蔡树阳,上海财经大学在读博士生二年级,导师为上海财经大学崔万云副教授。研究方向为NLP和大语言模型,主要包括知识图谱和数据挖掘,曾获国家奖学金。


扫码下方二维码

进入直播间观看



🔍


现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧


·
·

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
【今晚直播】队列研究:临床医生的“时间机器”OpenAI回应ChatGPT服务故障;新研究以99%准确率识别ChatGPT生成化学论文;三星发布自研大模型丨AIGC日报早鸟报|微信内测“划线卡片”功能;淘宝增加ChatGPT入口“淘宝问问”;湖南卫视接棒双十一猫晚直播...近期值得入手的好书 | 今晚直播直播预告 | 上海财经大学博士生蔡树阳:通过单个空格逃避ChatGPT检测器惊呆!某院医生4个月用ChatGPT写了16篇论文,发表5篇!(附ChatGPT干货)由留美博士生枪杀案看博士生的心理问题埃默里大学​计算机系金卫招收多名 2024 年秋季入学博士生,提供全额奖学金一文总结13个国内外ChatGPT平替产品:是时候可以不那么依赖ChatGPT了~【几个神奇的地方】【A Few Magical Places】【今晚直播】当机器产生情感,人类未来会如何 | 对话《情感经济》作者拉斯特博士招生:乔治梅森大学朱老师招收2024年入学博士生,提供全额奖学金SafetyBench:通过单选题评估大型语言模型安全性顶刊TIP 2023!重新思考跨域行人检测:无实例单阶段检测器的背景聚焦分布对齐框架带母亲去逛奥特莱斯加州大学圣迭戈分校,校园外就是海岸线 | 心理学博士/认知心理学博士/临床心理学博士项目介绍现金换钥匙赶房客如果成功有捷径?| 今晚直播年仅38岁!国防科技大学博士生导师因公牺牲【10年海外留学+工作,头部咨询公司负责人】Tracy许,女,日本东京工业大学博士及博士后,海归博士后待遇,高158,广州天河历经3年、17位医生都没有确诊的病例,靠ChatGPT找到正确的诊断。找ChatGPT看病到底是否靠谱?今晚直播!中考分流、高考分层,“被剩下的孩子”出路何在?| 全人教育系列MIT华人博士生将ChatGPT搬进Jupyter,自然语言编程一站式搞定惊了!某院医生用ChatGPT4个月写了16篇论文!成功发表5篇!(附ChatGPT干货教程)你不知道的并不等于没发生ICCV 2023|目标检测新突破!AlignDet:支持各类检测器完全自监督预训练的框架北卡大学华人博士生枪杀华人导师被逮捕; Chester拟建天然气工厂引发居民强烈抗议; 赴华人员无需进行新冠检测今晚直播 | 上海财经大学博士生陈畅欣:学习重排中的深层次排序表示文末送书 | 4个维度讲透ChatGPT技术原理,揭开ChatGPT神秘技术黑盒!今晚直播 | ACL 2023原作解读:研究评测与提升大语言模型时间推理能力南京大学智能科学与技术学院招募2024级硕士生及申请审核制博士生痛心!年仅38岁,国防科技大学博士生导师冯旸赫因公牺牲【今晚直播】房地产困局与中国城镇化的新思路 | 对话《人地之间》作者陶然今晚直播 | StructGPT:面向结构化数据的大模型推理框架莫斯科十大著名景点
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。