王牌课程请AI做助教,看完哈佛这波操作,才发现AI是福是祸,只在一念之间
看点 近日,哈佛大学宣布,从秋季学期开始,将使用自主研发的语言模型CS50 Bot,作为计算机科学入门这一高人气课程的助教,新一届学生因此将成为“第一批吃螃蟹”的人。此举引起网络热议,有人担忧:AI会将破坏学生的动力学习;哈佛教授则表示,AI助教可以缓解现实教学困境,改善学习体验。
支持外滩君,请进入公众号主页面“星标”我们,从此“不失联”。
文丨Luna 编丨Jennifer
自去年以来,AI话题的热度就一直不减。但是,看到哈佛将在王牌选修课上“聘用”AI,还是让人不由得吃惊:“AI的应用,进化得这么快的吗?”
这个消息源自《哈佛深红报》,CS50(计算机科学入门)的主讲教授David Malan确认,这门课从秋季学期开始,AI将和50位课程助理(Course Assistant)、教学助理(Teaching Fellow)一起,为学生服务(TF是比CA更高级的助教)。
《哈佛深红报》报道标题&Malan在推特的回应
这次使用的AI不是大家熟悉的GPT-3.5或者GPT-4,而是哈佛自己在此基础上研发的一个语言模型CS50 Bot。它将负责回答一些课程的常见问题,给学生的作业提出修改意见,并在其他助教的工作时间之外,随时回答学生的各种疑问。
此次AI担任助教的CS50课程,可是哈佛的高人气课程,近十年来,每年选课人数少则500,多则800。甚至有其他专业的学生上完课以后,转到了计算机科学专业或者转而从事这个专业的相关工作。
CS50每年选课人数统计
这样一门热门课,在哈佛还没有针对AI推出完备的教育应用方案时,就直接引入AI助教,让人不禁感叹“哈佛真敢啊!”
网络上的热议也是各有想法:
也有人质疑AI的能力,反问哈佛每年学费高达5万美元,是不是拿AI糊弄学生?
也有人担心,AI会不会将让学生不再有动力学习,甚至彻底颠覆人类的认知发展。
那么,作为美国顶尖学府的代表之一,哈佛应用AI助教,到底是怎么想的?面对种种AI危机的疑虑,哈佛又有怎样的思考?
哈佛最热门的CS50也有差评
AI助教是来“救火”的
AI是不是会取代人类老师?这是很多人在看到哈佛新闻后的第一反应。
不过,翻阅一下《哈佛深红报》的报道,就会发现,这次的助教CS50 Bot与其说是来取代人类助教,代替教授上课,倒不如说更像是来“救火”的。
一方面,主讲教授Malan一直把CS50 Bot定位为学生的学习工具,从来没有提到要由Bot来主讲,就连助教身份,Bot也“低人一等”,它给出的建议只有经过其他助教的确认,才能被认为是“准确的”;
另一方面,Malan迫切地希望AI能改善学生的学习体验,让这门近千名学生的大课,也能提供24小时一对一的辅导。放在以前,这是不可能完成的任务。
Malan既是在策划一场大型AI测验,又考虑到了现实教学的困境。
在很多人的印象中,哈佛的王牌课程都自带光环——在CS50的YouTube录播中,David Malan站在桑德斯剧院宽敞的舞台上,像表演戏剧般讲解那些复杂的计算机概念。
如果你很幸运在哈佛就读,那么还会知道,这门课还有个庞大的助教团,为学生们提供参考资料和作业辅导。
但是今年3月,《哈佛深红报》的另一篇报道《Undervalued, but Highly Utilized》却揭开了这些大型入门课光鲜背后的辛酸。
《哈佛深红报》关于助教的报道
“Malan教授在台上奉献了精彩的讲座,但除此以外的学习都靠助教。”曾任CS50教学助理的学生Fernandes说出了自己的看法,“本质上说,是教学助理撑起了这门课。”
管理教授的office hours、领导小型辅导、参加每周的员工会议,还算是助教的合理工作。如今,他们还要在课后长时间答疑,准备大部分课程材料。
这些负担已经远超学校协议的规定——教学助理每周最多可以得到10小时工作量的酬劳,课程助理最多只能计算4小时的工作量。按照这个标准,Fernandes每周留给作业点评的时间只有3小时。纵然助教团有几十个人,每人3小时也忙不过来。
CS50现任的教学助理Leggett还补充了一个“槽点”:“助教还要支持CS50的作品展,可是往往后一天就是我们自己高级计算机科学的期末考试,协议从来没提到这种时间冲突,后果只能我们自己承担。”
这样的情况,CS50不是例外。概率导论、生命科学综合导论都是如此。
除了学生助教有不满,选修课的学生也吃了不少“哑巴亏”。
哈佛的招生网站上写道,“作为世界级的教育工作者,教授们与学生们并肩工作,鼓励他们用新的眼光看待问题。”但很多哈佛学生却觉得,自己只是听教授讲座的观众,真要说和学生并肩工作的,还是助教。
“虽然学生确实有可能直接接触到全球最伟大的一些学者,但这种机会比看起来小得很多。”《哈佛深红报》如此评价。
更何况,助教毕竟也是学生。他们再怎么热爱自己的学科,和教授之间知识、思维、教学的差距是真实存在的。
有选修了生物入门课的学生抱怨,助教虽然懂得很多,但是辅导水平堪忧,并不能将复杂的概念转述成她能理解的表达,最后还是让她靠背诵和记忆。
还有的助教,囿于知识储备和理解,给出的见解和教授的观点矛盾,这对本来就有疑惑的学生来说简直雪上加霜。
正在攻读博士学位的Kyle Waldman说,除非是小班课或者学生自己很外向,否则教授“很难与学生进行持续的互动”。与规模较小的学校相比,哈佛学生很“吃亏”。
学生想要更多的辅导,助教呼吁减少工作,教授难以在研究和教学之间找到平衡。学生需求和人力、时间成本的矛盾越来越突出。
既然无法禁止学生使用AI,
那不如“化敌为友”,利用AI的优势
Malan让AI助教来“救火”,这样利用AI的方式,在哈佛的一众教授里也显得比较“激进”。但实际上,这已经算动作慢的了。
学生的手脚比教授们的对策更快。去年年末ChatGPT刚出圈,就有哈佛学生开着ChatGPT,参加线上开卷考试,而且还不是个例。
直到1月下旬,本科教育办公室的邮件才姗姗来迟,请老师们重视ChatGPT的影响,但并没有给出具体的规定,决策权交到了老师手中。
哈佛大部分教授对AI技术的影响持负面态度,因此很多课都明令禁止使用ChatGPT,比如宗教、西班牙语、物理课。
更多的老师意识到,想要全面禁止已经不太可能,所以想方设法减少学生使用ChatGPT的机会,推着学生亲自学习。
此前,法语课的主要评估就都放在课堂上完成,限制学生利用谷歌翻译这种工具。ChatGPT风靡之后,讲师Amanda Gann又把期末评估改成了“论文+对话”的方式,随时提问,防止学生用ChatGPT提前写好稿。
Gann坦言,如果不是ChatGPT,口头评估不会有如今这样的重要地位。这也激励着她去反思自己的作业:“这是只有人类才能做的吗?”“怎样让学生一开始就不想用AI来完成?”
英雄所见略同。计算机科学教授Boaz Barak也提高了作业和考试的难度。
以前,编写一个简单的神经网络代码就足以完成一份作业;但现在,学生要在尖端研究的启发下,再现一个更加复杂的代码。“既然学生能接触到更先进的工具,那我自然要提出更多要求。”
“英语:大数据的黑暗面”的Maria Dikcis教授则更进一步,鼓励学生批判性地使用ChatGPT。她在作业中,尝试让学生与机器智能较量:由学生自己先写一篇简短的分析文章,再用ChatGPT就同一主题生成一篇论文,然后比较两篇文章。她希望学生能看到AI辉煌表象背后的缺点,还能思考这些缺点的意义和价值。
相比之下,CS50的AI助教,更有一种“化敌为友”的感觉。老师们担心学生使用AI是因为ChatGPT实在太容易使用了,那不如反过来利用这一点,让AI成为24小时在线的助教。
这个想法,也和Malan一直在探索的个性化学习体验契合。为了让水平参差不齐的学生,能一直保持对CS50的兴趣,Malan和助教设计了不同难度的作业。
CS50课程学生学习感受统计&分层作业设计
比如为图片设计滤镜,能力比较弱的学生,可以写一个黑白滤镜,而能力比较强的学生,可以挑战胶卷底片+反色的滤镜。
不同水平的学生可以自由选择作业难度
但解决了学生的问题,助教的时间矛盾还在。他们花费很多时间来点评作业,可读评语花不了学生14秒,修改之后,又是漫长的等待才能获得回复。“这对助教和学生来说,都不是高效利用时间的方式。” Malan说。
而AI的便利性就像是缺少的那块拼图碎片。因此,Malan让AI助教承担了很多程序性、重复性的工作。虽然目前AI助教的修改意见读起来仍然有股“机器人味”,但是一针见血找到问题,还给出详尽的解释,倒也获得了“weirdly informative”的评价。
测试中的CS50 Bot
AI助教是大型技术测验,也是给学生示范了如何合理使用AI。在此之后,Malan还希望能够在其他STEM课,甚至人文课上,融入AI技术,为教学带来一些变革。
做学习的主人,还是技术的傀儡?
AI是一柄达摩克里斯之剑
不过,教学方法的改变似乎仍然无法解决一个疑问——AI来势汹汹,人类能坚守阵地,不被取代吗?
哈佛大学的心理学教授Steven Pinker的经历就是一个很直观的回答:
可以说,思维能力是人类独有的优势,逻辑能力还只是其中之一。学生能否在学习中锻炼各种思维能力,决定着和AI“对垒”的结果。在这个问题上,哈佛的教授们也强调了AI思维能力的各种弱势。
缺乏批判性思维,就是目前AI的另一个明显弱点。
《麻省理工科技评论》早早就发文提醒,因为互联网上存在大量偏见和仇恨的语言,以此为训练集的AI会进一步放大这些偏见。
另外,生成虚假内容也一直是AI的明显问题。今年3月,监管机构NewsGuard的专家又发现,GPT-4竟然100%地对虚假新闻做出了回应,GPT-3.5至少还能对20%的虚假消息回复“这些说法毫无根据”。
NewsGuard关于GPT-4的报道
再加上GPT-4比以前更不“擅长”编程,在CS50上引入的AI助教,也引起了一些质疑。Malan自己也预测,AI助教在一开始可能会“偶尔表现不佳甚至出错”。
但他认为,这恰恰是学生锻炼思维能力的机会,他告诉学生“在接收信息时,无论来源是AI还是人类,始终要进行批判性思考。鉴别信息真伪,评估可信程度,再决定是否接受对方的信息。”
推理和思考能力,也是AI的弱势,尽管这一点非常有迷惑性。
有学生用ChatGPT概括阅读材料的大意,它逐字逐句的输出方式,让人感觉它真的在思考。但真是这样吗?
哈佛肯尼政治学院公共政策的Soroush Saghafian副教授,把这称为AI的瑕疵。“人们认为AI会思考、会推理,甚至认为它无所不能,都是商业炒作的结果。”
人工智能初创公司MosaicML的首席科学家Frankle也验证了这个说法:“初创公司开发AI的目的一直都是构建一个很棒的语言模型产品,而不是发布和分享知识,这只是附带的效应。”
Saghafian认为,学生要主动与ChatGPT互动,更要了解AI本身的弊端。“2000年那会儿,老师教导学生认识谷歌这样的搜索引擎在思考上的弊端,如今对待ChatGPT也需要如此。学生要了解推理思考和单纯输出内容之间的差别。”
人类的思维能力从哪里来?必然是学习过程中来。但在特别需要高分和高绩点的时候,学生也难免会用ChatGPT来偷懒。即便是哈佛的教授们,能使用的手段也有限,学习的决策最终还是在学生手里。
尽管如此,哈佛大学和教授们还是尽可能地启发着学生:
哈佛把学习的意义称为智力转型的价值。
“改变自己必然很困难。学习量子力学原理或是了解工业革命前的社会,都需要解构自己的世界观并重新构建。因此,哈佛大学不是单纯强调学术道德,也是期望学生能够经历这一艰难的过程。”
哈佛德语和比较文学教授John Hamilton的一段话更为深刻:
如果黄金充足,我们就不会关心黄金;如果我们能永生,也不会太关心生活。我们的关心来自于有限的能力。没有限制的生活最终会没有价值。
关注外滩教育
发现优质教育
微信扫码关注该文公众号作者