Redian新闻
>
ChatGPT最新测评发布,超半数美国人无法区分人类写作与机器写作

ChatGPT最新测评发布,超半数美国人无法区分人类写作与机器写作

文化

近日,围绕ChatGPT的讨论仍在国外社交媒体上持续发酵。据知名统计网站Tooltester(工具测评者)最新调查报告显示,美国超一半受试者无法区分人类写作与机器写作,且随着升级版GPT-4发布,这一比例升至63.5%。另有结果表明,介于18-24岁的年轻群体更容易被ChatGPT内容“欺骗”。




编译丨申璐

人工智能的进化,会在未来取代人吗?


近日,国外一家统计网站Tooltester(工具测评者)发布了针对ChatGPT使用情况的最新调查报告。该调查分两次进行,首次测评于2023年2月下旬开展,面向1920名ChatGPT的美国使用者,罗列了75段分别由真人写作、机器写作,以及机器写作结合真人编辑的内容,以问卷形式请受试者识别。在GPT-4推出后,补充征集了1394人进行二轮调查。结果表明,聊天机器人的迭代速度明显超出了普通大众的预估,多数使用者对机器写作内容的复杂程度了解有限,难以区分哪些网络内容是由真人编写。


在内容识别方面,超过53.1%的受试者无法准确从文本中挑出机器写作段落。而当GPT-4发布后,这一比例甚至升至63.5%。即便是对AI类工具更熟悉的受试者,能够作出正确判断的人也仅占48%。而就年龄段而言,介于18-24岁之间的年轻人更容易被机器写作“欺骗”,他们中有59.8%的人无法作出正确判断,尽管他们可能在日常生活中更频繁地接触到这类内容。有趣的是,在所有年龄段中,65岁以上老年人能够正确识别机器写作的比例是最高的(52%)


图源:Tooltester官网。


在内容领域上,机器写作是否更擅长编写特定主题内容?结果显示,AI聊天机器人更善于撰写健康类和旅行类内容,或者说人们更容易错将机器写作的这类文章误认为是真人所写。当不少受试者面对诸如扑热息痛的副作用、健身计划的制定、租车技巧,以及酒店省钱攻略这些AI生成文本时,他们倾向于认为这是真人写的。报告称,这意味着AI生成的健康、旅行类“小贴士”似乎要比真人写的还更加人性化。


值得注意的是,反而是技术类文章更容易识别。51%的受试者能够区分哪些“技术贴”是AI生成的,且这方面,女性受试者表现略优于男性(52.4%对49.9%)。综合上述内容领域数据显示,调查团队提示称,这可能也透露出一个危险难料的趋势,我们正在走向一个人工智能深度融入生活世界的未来,包括医疗保健。


此外,该调查还询问了受试者对机器内容的看法和信任程度。80%以上的受试者支持制定机器写作的相关规范条例。71.3%的受试者称,如果内容提供方,如商家、出版社等在未作说明的情况下发布AI生成内容,这会大大降低他们对品牌本身的信任度。总体而言,人们还是倾向于内容提供方能够主动标识内容生产方式,这是否会成为未来互联网世界的常态仍有待观察。


自2022年11月30日,知名人工智能研究实验室OpenAI发布ChatGPT以来,人工智能话题多次引发广泛讨论。这项能够理解上下文语境、学习人类语言进行对话,并完成邮件撰写、主题创作等任务的聊天机器人在短短几天便吸引上百万用户注册。今年3月,GPT-4的发布持续冲击着公众的既有认知。这份调查报告再度印证了一个基本现状,目前我们的确难以区分人类写作与机器写作。


参考链接:

1. Survey: ChatGPT and AI Content. Can people tell the difference?

https://www.tooltester.com/en/blog/chatgpt-survey-can-people-tell-the-difference/#Younger_people_struggle_more_with_identifying_AI_content

2. Half of Americans can’t pick phony AI writing from human writing.

https://lithub.com/half-of-americans-cant-pick-phony-ai-writing-from-human-writing/



本文为编译。作者:申璐;编辑:青青子;校对:赵琳。题图素材出自电影《我,机器人》剧照。欢迎转发至朋友圈。
     

p全年合辑!2022《新京报·书评周刊》年度合订本来啦!
点击阅读原文即可购买~

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
「ChatGPT之母」最新采访:GPT-4离超级智能还很远,半年内不会训练GPT-5一周国际财经|查尔斯三世加冕礼耗资1亿英镑,超半数受访者不愿买单;巴菲特股东会登场;白宫警告美债违约危机或致股市暴跌45%一期针对ChatGPT的全面测评:涵盖功能、性能、用户体验 |InfoQ测评室ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇女人出轨,会有三种“味道”,特别第一种,是洗不掉的高中教师养出40亿美元超级独角兽,还参与发布了ChatGPT最大平替半数美国人支持封禁TikTok 使用者中仅19%支持 科技股成美国股民“救命稻草”英伟达RTX 4070最新测评来了!光追效果更棒,但仅限于2k游戏炸掉北溪民用设施习不想做点啥近半数美国人担心银行存款安全港理工博士、雅思写作7.5的Rachel写作与批改【城事】巴黎市长将重修Châtelet 广场以方便行人南加“低收入”住房短缺近100万套,超半数租客负担重每日焦点——电价飙升开电动车充电比加油贵 今冬供暖费上涨36% 半数美国人钱包比去年更瘪ChatGPT 核心技术大起底——InstructGPT:研究人类反馈数据比加大模型规模更重要!我的厉害国, 下了狠手?新婚夜老婆发烧,我去买药忘拿手机,折回去开门:“娶个畜生呀”高中教师养出40亿美元超级独角兽,Stable Diffusion背后数据集创建者,还发布ChatGPT最大平替大羊驼、羊驼、小羊驼和ChatGPT比差在哪儿?CMU副教授测评了7个类ChatGPT大模型《吴恩达ChatGPT最新课程》,中文版来了!澳洲面临退休困境,“舒适退休”成本剧增,创历史新高!生活压力不断升级,超半数人将面临退休金吃紧,越来越多人选择这样节约生活成本重访西班牙(12)-黄金之城的欢歌“我已赚了$75万”ChatGPT对人类全是负面影响?不,它已经让一部分人赚得盆满钵满人类“3.0”意识形态战场——ChatGPT的政治化终局ChatGPT的价值观及立场(四)我内测了微软最新的 ChatGPT 版必应:比 ChatGPT 更像人,但有一个大隐患集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布重磅 | 我内测了微软最新的 ChatGPT 版必应:比 ChatGPT 更像人,但有一个大隐患GPT-4重磅发布,吊打ChatGPT!性能炸天:10秒做出一个网站,在考试中击败90% 人类AI 时代的“身份证”要来了?ChatGPT 之父推出加密钱包 World App,并称区块链可以区分人与 AI一个问题区分人类和AI!「丐版」图灵测试,难住所有大模型ChatGPT引领AIGC!Lehigh最新《AI生成内容》全面综述,44页详述GAN到ChatGPT发展历程ChatGPT带火AI芯片,赚翻了的英伟达发布新核弹:ChatGPT专用GPU,让推理提速10倍!突然出手!意大利封杀ChatGPT!马斯克也下场呼吁限制ChatGPT!AI发展可能超越人类思维?"ChatGPT之父"语出惊人! AI恐杀死人类 推理能力人类无法理解! 马斯克怕了: 暂停研究!微软发布Visual ChatGPT:视觉模型加持ChatGPT实现丝滑聊天
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。