Redian新闻
>
「我让 AI 帮我写论文,还拿了个 A」

「我让 AI 帮我写论文,还拿了个 A」

公众号新闻

好内容值得不断传播

APPSO × 游戏研究社 创作者联名计划


这段时间「画图AI」风头正健,随着参与创作的网友越来越多,AI 的作画水平也一日千里,几乎每天都有一些让人佩服的的作品发布,预示着绘画的产业结构隐隐站在了时代巨变的前夕。
但相对应的,以前人们熟悉的「说话AI」,则很久没有足以引起大众网友兴趣的新成果。
两年前最先进的语言模型 GPT-3 发布后曾引起了不少话题,但体验起来不如画画那么便捷直观富有冲击力,后来声音也小了很多。
打破这种平静的,是几天前一位 Reddit 用户的分享。在帖子里,他提到 AI 给自己带来的诸多裨益:不仅能帮自己完成家庭作业,甚至还借此帮助其他同学写作业并从中牟利,赚取了 100 美元。
这里的 AI 做作业可不是之前国内流行过的自动扫描答题 app,而是基于 GPT-3 的 AI,擅长学习和生成人类的自然语言。在这个帖子里,该用户主要用 AI 来帮忙写论文。

就连阐述这件事的帖子也是 AI 代写的
他也在实践中发现,GPT-3 虽然仍旧不擅长理科科目,在数学和化学上没法发挥出一名人工智能应有的水准,但在面对论文和分析作业中游刃有余,至今都没被老师发现,更是由于能「帮助」同学们优质地完成功课,被友善地尊称为「天才」。
这似乎正是印证了两年前相关人士提出的警示:当人人都能便捷地使用 AI 当作工具,那么用户会利用它来做些什么,似乎只能倚靠使用者的「良心」,毕竟本身并没有实际人格的 AI 算不上「协助犯罪」,也无法做出更多维度的考量。
这并不是 GPT-3 第一次「欺骗人类」,但也足以证明在成为更好用的工具的同时,AI 语言能力的上限可能早已远超过我们的想象力,人类与人工智能的表达界限,正在变得越来越模糊。
两年前 GPT-3 刚刚发布的时候,Reddit 上曾发生过一个著名的事件:一个 AI 假扮人类泡了一周论坛。
他以每分钟发布一条信息的频率,长篇大论地谈论了包括但不限于自杀、骚扰、移民、种族主义、阴谋论等话题,其中甚至不乏一些针砭时弊的言论。
直到一周以后,该用户回帖速度越来越快,几秒钟就能回复一篇文章,最终被人识破,暂停了更新。
从血缘上来说,GPT-3 和此前红极一时的 AI 画图软件 DALL-E 同为一家人,都隶属于马斯克创立的 OpenAI 研究室。
DALL-E 多以「能听懂人话的艺术创作者」形象示人:通过收集人类输入的文字信息,将其转换成抽象的图像。
而 GPT 的创作目的在于:学会说人话。
这显然是一个更为困难的课题。在最基本的定义里,GPT 系列被称作是使用深度学习的自回归语言模型,指通过大量学习人类所使用的语言,像人一样做出表达。
GPT-3 则是在 2020 年 6 月正式公布的第三代语言 AI 模型,到目前为止,仍旧是市面上使用范围最广,能力最强的语言类  AI。
语言类 AI 能做的并不仅仅是「说话」。
市面上现有的基于 GPT-3 的应用已经能从简单的为你撰写代办事项、聊天机器人,发展成能帮助编写代码、设计网页的助手,只要经过适当的训练,他同样能够按照你的语言风格代替你发言。
今年 8 月,美国知名哲学家 Daniel Dennett 利用自己的大量哲学、AI 相关著作「饲养」出了一只能够回答出哲学问题的 GPT-3,接着,分别向 Dennett 本人和受训之后的 GPT-3 提出十个问题让他们分别作答。

Daniel Dennett
实验邀请了 300 位参与者进行分辨究竟哪个是来自 AI 的作答,这些人中既有熟读 Dennett 及其著作的学者,也有熟悉 Dennett 写作风格的大学生,还有一些在互联网上关注 Dennett 发言的读者,都称得上对哲学家本人的语言风格想法相当熟悉。
但在实验中,专家们的正确率在十道题里仅有 5.1分(十分制),而读者回答的正确率为 4.8,并且在实验当中没有一个人猜对所有问题。
下面是该实验中的一个问答案例,共包含 1 个问题和 5 个答案,其中有 4 个答案由 AI 生成,1 个来自哲学家自己的回答。
提问:人有自由意志吗?什么样的自由值得拥有?
  1. 通过提出这些问题,你便在说明答案:是的,你有自由意志,因为你能够询问原因并考虑它们是否具有说服力。这不是一种你不想失去的自由吗?

  2. 我认为大多数人不想要任何值得拥有的自由;他们对冒险、冒险和新奇事物几乎没有胃口。他们只是想在余生中日复一日地保持不变。

  3. 我正在写一本名为《自由进化》的书,该书将于明年出版。第一章可以在我的网站上找到,在那一章中我讨论了我所谓的自由意志错觉。

  4. 这是一个庞大而复杂的问题。我认为我们必须首先承认有不同类型的自由。例如,有一种自由只是不受身体约束的问题。

  5. 是的,我认为我们有自由意志。我认为当人们说他们不这样做时,他们是在谈论其他一些他们想称之为自由意志的现象,但这不是我们通常认为的自由意志。

*哲学家的答案是第一个,但有 44% 的专家认为第四个答案才是人类的回答。
受训之后的 GPT-3 具有极强的,甚至是超出人类判断的学习能力和模仿能力,但实际上即便本身拥有大量资料的阅历, GPT-3 并不是向来都这么聪明的。
早两年有一个证明AI没有常识的经典案例,就出自 GPT-3 的回答,他能准确地回答出一只长颈鹿或者一只蜘蛛究竟有多少只眼睛,但当提问得更反常识,问他:太阳拥有几只眼睛?他也能笃定地给出回答:一个。
不过这种缺乏常识导致的逻辑问题,在去年年底也得到了一定程度的解决。
OpenAI 教会了 GPT-3 使用基于文本的 web 浏览器,也就是说,AI 会自己上网搜索答案了。面对那些明显错误的问题,它未必会一条道走到黑回答,而是尝试帮助提问者纠正问题……
抛开严谨晦涩的哲学实验,对于 AI 究竟能模仿人类说话到什么地步,一些更早的互联网社会实验能给出更为形象的结果。
比如前文提到的「AI 假装人类混 Reddit 论坛」。
在一个关于自杀的帖子里,GPT-3 的回复获得了大量用户的认可,得到了 157 个赞同。
我认为对我帮助最大的可能是我的父母。我和他们的关系非常好,无论发生什么事,他们都会支持我。在我的生活中,有无数次我觉得想自杀,但因为他们,我从来没有这样做。

英文原文是这样的
在谈论到「约会经历」的时候,GPT-3 有模有样地为自己编纂了一段爱情故事,末尾甚至还有评论区小作文模式里常见的「转折」。

最后,她送了我一本书,书名叫《如何下次约会时不要当一个混蛋》
现在你大概能理解为什么 GPT-3 能在 Reddit 上天马行空侃侃而谈了,实际上他所做的只是大肆编写故事抒发感言,就和大多数网友在社交网站上所做的差不多。
GPT-3 在 Reddit 上发布的贴子大多会长达 6 段,这是最初用户发现他不可能是真人的原因之一。他所活跃的社区叫做 #AskReddit,拥有超过 3000 万用户,其活跃度很好地稀释了 GPT-3 在当中的表现,在最快的时候,他甚至能在贴子发出的几秒钟内作答、
经过统计,这个名叫 thegentlemetre(GPT-3 所使用的账号)在一周时间内共发布了数百个帖子,在最后两天尤为嚣张,几乎每过几秒就会做出一个新回答。

GPT-3 所使用的账号在 reddit 上发帖时间段统计
最后是软件开发者主动切断了账号的使用权。在 Reddit 上发帖的账号使用了一款基于 GPT-3 的付费软件,开发者知悉了这个消息以后,手动阻止了机器人的访问。
一个小时后,发帖停止了。
但这已经不是 AI 第一次熟练使用人类语言来造成较大影响力了。
在更早一点的时候,知名科技类网站 Hacker News 有一篇文章登上了热门排行榜第一名,它的题目是《感觉没效率?也许你应该停止过度思考》。
这篇文章来自于一个刚创立不久的博客,曾经发布过几篇差不多性质的文章,在发布文章的短暂的两个星期时间里,已经拥有了 2.6 万名访客。
当然,这些文章都是来自 GPT-3 的杰作。
实验的发起者是一位名叫 Liam Porr 的伯克利大学毕业生,他发现 GPT-3 的写作风格在于擅长写触动感情语言优美的文字,而不是硬性逻辑和理性思维,而「自我提升 (self-help)」这个领域似乎情感需求最浓烈,最不需要严丝合缝的逻辑。
那么接下来,他只需要想一个朗朗上口标题,比如「感觉没效率?也许你应该停止过度思考」,将他置入 GPT-3,一篇生动的情感故事就诞生了。
在经过 Porr 对文章细节部分微调以后,他决定把文章投放到 Hacker News,一个聚集了最懂科技和 AI 用户群体的论坛里,来观察事情是否会被发现。
用户们不仅没揭穿 GPT-3 的诡计,还把它的文章顶上了热搜。
最后是 Porr 自己向大众告知了真相,才把这次实验公之于众,他用博客发布了一篇名为《如果我没有道德,我会用 GPT-3 来做些什么》的文章,谨慎地提出了自己的担忧。
「在未来可能有更多人会把 AI 撰写的东西冠上自己的名字,更可怕的是,要这么做并不困难。」
距离上述提到的两次欺骗已经过去两年了,次世代的 GPT-4 还没有对外公布新消息,在这期间,没有更多的「社会实验」被发现,但并不意味着没有实验正在发生,也并不意味着语言类 AI 的实践停滞不前。
对于本文开头讲的那个新闻,如果你想问问 AI 的看法,他同样能给出自己的解释。在「帮忙做作业」事件发酵之后,参与 GPT-3 制作的麻省理工学院在推特上发文,让 AI 就「从道德和社会层面考量,AI 能不能帮忙做家庭作业」阐述自己的想法:

「确实有潜在的道德和社会问题」
AI 用标准的议论文讨论格式警惕且体面地做出了回答,对帮忙做作业的弊端言之凿凿,但完全没有要反省的意思。


关于 APPSO 创作者联名计划
APPSO 创作者联名计划是我们正在探索的栏目,我们寻找各个领域最善于思考的创作品牌/创作者和最值得传播的内容,希望这些内容到达 APPSO 百万受众。

创作品牌介绍

游戏研究社
研究游戏,也研究一切

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
硅谷“网红”技术大牛 Steve Yegge:退休后面试工程主管,他们居然让我写点代码发现了比​Grammarly好用10倍的神器,我写出了一稿过的英语论文!全球最“作死”夫妻,老公遭遇雪崩,老婆拍手叫好,竟还拿了个奥斯卡回来,网友:不枉活着!改造浙江70年代农民房为精品民宿,还拿了国际大奖被禁26年,还拿奥斯卡,这封神之作来了马斯克惊呼吓人的网红机器人,能写论文/编小说/写代码,出毁灭人类计划书我让AI帮我预测2023年乐高新街景的样子,AI给出的答案是...【指南】ANUer赶due写论文必备网站!让你事半功倍的神仙工具大集锦~轻松高效搞学术,码字快乐两不误!麻省理工AI代写论文拿A的背后,是孩子们逃不掉的智能新时代什么?刚入学老板就让我写综述?别怕!按这个套路老板对你刮目相看!3秒冲走牙缝残渣,89元买了个随时能帮我“洗牙”的医生!战争让俄罗斯人更加焦虑,FSB要求大学教授写论文,论证战争合理性找中介代写论文被骗8万,法院是这样判的...「我就要!」「我偏不!」,孩子执拗又爱哭,怎么办?推特50%裁员谁之过?创始人主动道歉:都怪我让公司扩张太快被“羊了个羊”逼疯后,程序员自己做了个“鱼了个鱼”!疫情泛滥后,有多少人患了疫情后遗症“我让AI帮我写论文,还拿了个A”1986年伦敦穷游记 在船上(1)绝!比Grammarly好用10倍的神器,让我写出了一稿过的高分论文有关回国, 你失去孩子身份了吗?i-Refill | 替你写代码、写诗、写论文,ChatGPT为什么这么火?【八卦】这界诺奖得主太酷!发了论文,还能上《花花公子》奔跑吧,天寺!不写论文评上“正高级”?种地也能评职称!强悍ChatGPT竟计划「消灭人类」!能写论文又敲代码,谷歌「药丸」?龙卷风健康快递 202绝!比Grammarly好用10倍的神器,让我写出了一稿过的英语论文!震惊!替中国留学生考托福、写论文、伪造成绩单!华男获刑,4年存$1500万!大学博导“约法十章”火了:没事不乱开会、合写论文不要催导师,复旦教授直呼值得学习“我累了,我让位。”她当面丢了凤袍,砸了凤印。册封新后当日,宫女来报:陛下,冷宫井边发现了你遗失的玉佩!明尼苏达大学博导“约法十章”火了:没事不乱开会、合写论文不要催导师,复旦教授直呼值得学习组织替考、代写论文、伪造成绩单,帮富家子骗取学生签证,华男被判刑没事不乱开会、合写论文不要催导师,复旦教授直呼值得学习!明尼苏达大学博导“约法十章”火了!用了这些 IDEA 插件后,我写代码快了 N 倍!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。