Redian新闻
>
ChatGPT最新测评发布,超半数美国人无法区分人类写作与机器写作

ChatGPT最新测评发布,超半数美国人无法区分人类写作与机器写作

文化

近日,围绕ChatGPT的讨论仍在国外社交媒体上持续发酵。据知名统计网站Tooltester(工具测评者)最新调查报告显示,美国超一半受试者无法区分人类写作与机器写作,且随着升级版GPT-4发布,这一比例升至63.5%。另有结果表明,介于18-24岁的年轻群体更容易被ChatGPT内容“欺骗”。




编译丨申璐

人工智能的进化,会在未来取代人吗?


近日,国外一家统计网站Tooltester(工具测评者)发布了针对ChatGPT使用情况的最新调查报告。该调查分两次进行,首次测评于2023年2月下旬开展,面向1920名ChatGPT的美国使用者,罗列了75段分别由真人写作、机器写作,以及机器写作结合真人编辑的内容,以问卷形式请受试者识别。在GPT-4推出后,补充征集了1394人进行二轮调查。结果表明,聊天机器人的迭代速度明显超出了普通大众的预估,多数使用者对机器写作内容的复杂程度了解有限,难以区分哪些网络内容是由真人编写。


在内容识别方面,超过53.1%的受试者无法准确从文本中挑出机器写作段落。而当GPT-4发布后,这一比例甚至升至63.5%。即便是对AI类工具更熟悉的受试者,能够作出正确判断的人也仅占48%。而就年龄段而言,介于18-24岁之间的年轻人更容易被机器写作“欺骗”,他们中有59.8%的人无法作出正确判断,尽管他们可能在日常生活中更频繁地接触到这类内容。有趣的是,在所有年龄段中,65岁以上老年人能够正确识别机器写作的比例是最高的(52%)


图源:Tooltester官网。


在内容领域上,机器写作是否更擅长编写特定主题内容?结果显示,AI聊天机器人更善于撰写健康类和旅行类内容,或者说人们更容易错将机器写作的这类文章误认为是真人所写。当不少受试者面对诸如扑热息痛的副作用、健身计划的制定、租车技巧,以及酒店省钱攻略这些AI生成文本时,他们倾向于认为这是真人写的。报告称,这意味着AI生成的健康、旅行类“小贴士”似乎要比真人写的还更加人性化。


值得注意的是,反而是技术类文章更容易识别。51%的受试者能够区分哪些“技术贴”是AI生成的,且这方面,女性受试者表现略优于男性(52.4%对49.9%)。综合上述内容领域数据显示,调查团队提示称,这可能也透露出一个危险难料的趋势,我们正在走向一个人工智能深度融入生活世界的未来,包括医疗保健。


此外,该调查还询问了受试者对机器内容的看法和信任程度。80%以上的受试者支持制定机器写作的相关规范条例。71.3%的受试者称,如果内容提供方,如商家、出版社等在未作说明的情况下发布AI生成内容,这会大大降低他们对品牌本身的信任度。总体而言,人们还是倾向于内容提供方能够主动标识内容生产方式,这是否会成为未来互联网世界的常态仍有待观察。


自2022年11月30日,知名人工智能研究实验室OpenAI发布ChatGPT以来,人工智能话题多次引发广泛讨论。这项能够理解上下文语境、学习人类语言进行对话,并完成邮件撰写、主题创作等任务的聊天机器人在短短几天便吸引上百万用户注册。今年3月,GPT-4的发布持续冲击着公众的既有认知。这份调查报告再度印证了一个基本现状,目前我们的确难以区分人类写作与机器写作。


参考链接:

1. Survey: ChatGPT and AI Content. Can people tell the difference?

https://www.tooltester.com/en/blog/chatgpt-survey-can-people-tell-the-difference/#Younger_people_struggle_more_with_identifying_AI_content

2. Half of Americans can’t pick phony AI writing from human writing.

https://lithub.com/half-of-americans-cant-pick-phony-ai-writing-from-human-writing/



本文为编译。作者:申璐;编辑:青青子;校对:赵琳。题图素材出自电影《我,机器人》剧照。欢迎转发至朋友圈。
     

p全年合辑!2022《新京报·书评周刊》年度合订本来啦!
点击阅读原文即可购买~

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
「ChatGPT之母」最新采访:GPT-4离超级智能还很远,半年内不会训练GPT-5《吴恩达ChatGPT最新课程》,中文版来了!集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布ChatGPT引领AIGC!Lehigh最新《AI生成内容》全面综述,44页详述GAN到ChatGPT发展历程近半数美国人担心银行存款安全重磅 | 我内测了微软最新的 ChatGPT 版必应:比 ChatGPT 更像人,但有一个大隐患ChatGPT 核心技术大起底——InstructGPT:研究人类反馈数据比加大模型规模更重要!ChatGPT带火AI芯片,赚翻了的英伟达发布新核弹:ChatGPT专用GPU,让推理提速10倍!微软发布Visual ChatGPT:视觉模型加持ChatGPT实现丝滑聊天【城事】巴黎市长将重修Châtelet 广场以方便行人南加“低收入”住房短缺近100万套,超半数租客负担重大羊驼、羊驼、小羊驼和ChatGPT比差在哪儿?CMU副教授测评了7个类ChatGPT大模型“我已赚了$75万”ChatGPT对人类全是负面影响?不,它已经让一部分人赚得盆满钵满高中教师养出40亿美元超级独角兽,还参与发布了ChatGPT最大平替"ChatGPT之父"语出惊人! AI恐杀死人类 推理能力人类无法理解! 马斯克怕了: 暂停研究!GPT-4重磅发布,吊打ChatGPT!性能炸天:10秒做出一个网站,在考试中击败90% 人类高中教师养出40亿美元超级独角兽,Stable Diffusion背后数据集创建者,还发布ChatGPT最大平替一期针对ChatGPT的全面测评:涵盖功能、性能、用户体验 |InfoQ测评室港理工博士、雅思写作7.5的Rachel写作与批改人类“3.0”意识形态战场——ChatGPT的政治化终局ChatGPT的价值观及立场(四)半数美国人支持封禁TikTok 使用者中仅19%支持 科技股成美国股民“救命稻草”英伟达RTX 4070最新测评来了!光追效果更棒,但仅限于2k游戏突然出手!意大利封杀ChatGPT!马斯克也下场呼吁限制ChatGPT!AI发展可能超越人类思维?女人出轨,会有三种“味道”,特别第一种,是洗不掉的我的厉害国, 下了狠手?重访西班牙(12)-黄金之城的欢歌炸掉北溪民用设施习不想做点啥一周国际财经|查尔斯三世加冕礼耗资1亿英镑,超半数受访者不愿买单;巴菲特股东会登场;白宫警告美债违约危机或致股市暴跌45%AI 时代的“身份证”要来了?ChatGPT 之父推出加密钱包 World App,并称区块链可以区分人与 AI澳洲面临退休困境,“舒适退休”成本剧增,创历史新高!生活压力不断升级,超半数人将面临退休金吃紧,越来越多人选择这样节约生活成本每日焦点——电价飙升开电动车充电比加油贵 今冬供暖费上涨36% 半数美国人钱包比去年更瘪ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇我内测了微软最新的 ChatGPT 版必应:比 ChatGPT 更像人,但有一个大隐患新婚夜老婆发烧,我去买药忘拿手机,折回去开门:“娶个畜生呀”一个问题区分人类和AI!「丐版」图灵测试,难住所有大模型
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。