avatar

使用GPT

pathdream
楼主 (北美华人网)
如果允许学生用AI“作弊”,他们的成绩分布会发生怎样的变化? 针对这个问题,真有几位大学教授正儿八经研究了一番,并写下了长达62页的研究论文。 结果发现,使用GPT-4后,学生的“能力曲线被压缩了”,差生和优等生的差距缩小。 沃顿商学院教授分享了这项研究后,引起不少网友讨论。网友对这样的结果也感觉很意外: 和我的预期完全不符啊,还以为所有人分数都会提高。 还有网友称这是“真正的游戏规则改变者”: AI正在改变教育格局,在缩小差距的同时提高标准。 不过也有网友持不同观点: 擅长使用AI的人可能表现会非常出色,那种看起来差距缩小的情况可能只是因为有满绩点4.0这一上限: AI会是“平衡器”吗? 除了上面所说的,我们查看论文,发现研究人员还得出了这些结论: 使用GPT-4对参与者总体任务完成的质量影响较小且不稳定;使用GPT-4显著减少了参与者完成任务的时间;平时技能水平较低的参与者在使用GPT-4后,任务完成质量提升最为显著,本就能独立高质量完成任务的参与者获得的质量提升较小;GPT-4能为所有学生节省相似的时间,无论他们原本完成任务的速度如何;即便参与者不了解自己在各项任务上的具体成绩,他们也能明确指出GPT-4最有效的应用场景。 下面一起来看实验详情。 具体来说,来自南加州大学Gould法学院、明尼苏达大学法学院的几位教授,以研究AI辅助对法律分析的影响为例。 给参与实验的60位来自明尼苏达大学法学院的学生提出了四项初级律师常见的任务:起诉状起草(Complaint Drafting)、合同起草(Contract Drafting)、员工手册起草(EE Handbook)和客户备忘录起草(Client Memo)。 不同的是,这些参与者随机分为两组(A组、B组),每组30人。A组参与者需使用GPT-4完成起诉状起草、合同起草任务,而B组使用GPT-4完成员工手册起草和客户备忘录起草任务。 实验前,全部学生都接受了约2小时的培训,了解如何有效使用GPT-4进行法律分析。完成任务过程中,参与者需记录自己完成任务的时间。 然后,研究人员在不知道参与者身份和其他信息的情况下,匿名完成所有作品的评分。 具体实验结果如下。 在4.0绩点机制上,使用GPT-4辅助后,学生在四项任务中的平均分数波动幅度为+0.17、+0.24、+0.07、-0.07。 可视化图表更直观: 总的来说,仅合同起草任务的表现在95%置信水平上展现出了统计学意义上的显著提升。 再来看使用和不使用GPT-4参与者,完成任务平均花费的时间: 可以直观地看到,参与者完成任务时间大大缩减: 更多数据和分析内容,感兴趣的朋友可查看论文。 值得一提的是,几位教授在论文最后,还写下了长达12页的启示,针对律师、法律客户、法官以及法学院、法学院学生提出了不同的建议。 其中指出:法学院需要重新考虑学生使用AI的时机和方法,以及在何种情况下应限制AI的应用,以便更好地适应未来实践的需求。 此外,针对不同人群的类似研究也不在少数。 职场中AI会是“平衡器”吗? 来自哈佛商学院、沃顿商学院、MIT斯隆管理学院等的研究人员联合波士顿咨询公司做了一项研究。 他们选取了波士顿咨询公司中的部分高知员工,让他们使用AI辅助完成分析、创意构思和说服技巧等18项任务测试。 结果发现,原本表现位于团队下半层的顾问们在AI辅助下成果质量提升了43%;而平时表现在上半层的顾问仅提升了17%。 使用GPT-4之前,顶尖员工与其他员工之间的平均差距为22%;使用之后,这一差距显著缩小至4%。 MIT的一项研究同样表明,使用ChatGPT之后,高水平写作者和低水平写作者的表现差异缩减了一半。 创意写作领域亦见相似现象,伦敦大学学院、埃克塞特大学研究人员的一项实验表明,创意作家技能差距缩小,GPT-4提供的五个创意灵感“有效地平衡了不同创造力水平作家的创造力评分”。 不过,尽管有多项研究表明使用AI可以缩减人们之间的技能差距,但正如论文分享者、沃顿商学院教授Ethan Mollick所言: 技能的造王者(King Maker)、加速器(Escalator)、平衡器(Leveler),AI究竟将扮演哪一种角色,并不是总是很清楚。 那么,你认为AI在你身边正扮演着哪种角色?
avatar
felali9
2 楼
以后只要靠天马行空胡思乱想就好,AI会帮你实现一切想法
avatar
平明寻白羽
3 楼
这不是no brainer么。
相当于差生有枪手代考。枪手也干不过学霸。对学霸帮助不大,对差生帮助大。
avatar
pathdream
4 楼
这不是no brainer么。
相当于差生有枪手代考。枪手也干不过学霸。对学霸帮助不大,对差生帮助大。
平明寻白羽 发表于 2024-02-16 11:23

枪手1.5出来了 秒杀学霸
avatar
stephanieus
5 楼
这是在学渣和学霸都使用GPT-4的情况下,学渣比学霸更高分吗?还是学渣用,学霸没用?文章太长了,看不下去。
avatar
北上广奥数家
6 楼
沃顿商学院教授整天就搞这种“研究论文”,AI不淘汰你淘汰谁?
avatar
FatSheep
7 楼
这他妈的就是给资本家背书,用GPT以后公司只需要高中毕业就行,不用大学也不需要能力优秀。
avatar
artdong
8 楼

别做梦了。
已经有一大堆测试论文是否ChatGPT写的软件了,到时候学渣非但拿不到好成绩还给人因作弊开除了。
avatar
婚纱旗袍晚礼服
9 楼
使用枪手,学渣考第一。 有意思吗 抢来500万,抢劫犯也能豪车香槟 大概是这个意思吧
avatar
doublemint
10 楼
这还用作研究?真的研究经费都是这么浪费的。 普通人用AI下国际象棋进步大还是棋圣下国际象棋进步大? 本来人的限制就在记忆力和多步演算上面。
avatar
doublemint
11 楼

别做梦了。
已经有一大堆测试论文是否ChatGPT写的软件了,到时候学渣非但拿不到好成绩还给人因作弊开除了。
artdong 发表于 2024-02-16 12:50

让我想起测三聚氰胺的检测方法了。 先卖AI让你用来作弊赚一笔,再卖反作弊软件再赚一笔。 马公稳赢
avatar
miaka
12 楼
以后不存在作弊这个词了。老大妈与时俱进吧。
avatar
suzichem
13 楼
学渣与学霸都难以区分
avatar
01am
14 楼
没有学术意义,有政治意义。 以后招生不用看成绩了,在gpt时代,学渣学霸考的差不多。
avatar
错过了2020
15 楼
我有时候用Chapgpt改语法,发现我写的对的句子,它能给我改得读起来怪怪的(e.g. thanks for contacting me and sending me the documents,它改成thanks for contacting me and for sending me the documents,这只是一个例子),很多时候还把我的意思都改了。
相关阅读
开心,孩子拿到了intern offer两首《万家灯火》证监会对4家企业拟香港上市,出具备案补充材料要求(反馈意见)(2024年1月12日—2024年1月18日)2024年2月1日医疗晨报证监会对1家企业拟美国上市,出具备案补充材料要求(反馈意见)(2024年1月26日—2024年2月1日)2024年还会好吗?看王煜全用GPT的分析成果|直播预告《再见,布里诺斯艾利斯》这是真的还是AI画的作别流年加拿大华人娃被围殴:3件大鹅、1件蒙口都被抢走了关于朱令铊中毒的一点讨论2024年2月美国移民排期:EB-5表A前进7天,表B开放使用!2024年2月1日历史上的今天发现小扎真的很爱晒老婆诶2024年还会好吗?看王煜全用GPT的分析成果嫉妒的心灵不美丽姐妹们,偏头痛有救吗痴迷养骗子的老人,有啥办法能劝到美国来休息几个月?日本旅游推荐,除了东京京都和大阪,还有哪里值得去?姐妹们给点正能量吧,这世界会变好吗2024年春节最堵的十大景区出炉,这场面太可怕了(视频)【冯站长之家】2024年2月1日(周四)三分钟新闻早餐大家住过北京的民宿吗?求推荐好的民宿美股基本面 - 2023_12_31 * 晨报 * 一入江湖岁月催!心中有基本,临危不慌张。新年快乐,来年再战。微软最新研究成果:使用GPT-4合成数据来训练AI模型,实现SOTA!德彪西的音乐图像:引言给裸根兰花安家,一起新年快乐吴恩达:别光盯着GPT-5,用GPT-4做个智能体可能提前达到GPT-5的效果为什么年龄越大,戾气就越重?我的初中(二):安得广厦千万间大家旅游住酒店 会买一次性床单枕套吗陈都灵这组图真是“我见犹怜”,却被网友说故意扮柔弱,你支持谁?贾玲瘦身后首登封《时尚芭莎》,这时尚感蹭蹭往上涨呀养宠物的有喜欢舔它们脸的吗?是不是比让宠物舔自己的脸还干净一些?股市💊要完,华尔街首席经济学家:美国经济将在 mid 2024陷入衰退鱼儿跃出水面吃果子,给旁边的泼猴干懵了2023虽然过的不尽人意但是也要总结一下!到底是蔬菜沙拉更健康,还是炒青菜更健康?感谢NVDA,总算浮出水面了系统地说说美国职场、人生与财富
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。