Redian新闻
>
AI「导师」进哈佛!7x24小时辅导CS课程,RAG或成AI教育最后一块拼图

AI「导师」进哈佛!7x24小时辅导CS课程,RAG或成AI教育最后一块拼图

公众号新闻



  新智元报道  

编辑:拉燕
【新智元导读】哈佛大学将AI引入CS课程,学生的个性化「导师」,学习效率拉满!

去年,哈佛大学做了件大事。

他们在自己的CS50课程中引入了一整套AI工具,堪称学生个人的个性化「导师」。

一开始,这套工具服务的对象是70来个上暑校的学生。后来逐渐开放,数千名线上学生也得以拥有属于自己的学习导师。

到了秋季,AI工具又面向了几百位本校学生开放,反响不可谓不强烈。

今天,我们通过一篇论文,来向全体读者朋友详细介绍这套AI工具的开发过程,相信每位同学都可以获益匪浅。

哈佛个人AI导师


首先,不同于传统学习过程中,学生们使用搜索引擎直接获得答案或是教学资料,这套工具的设计理念是,引导学生自主探索解决问题的方案,比较忌讳直接把答案摆出来。

这也是为什么这套工具一经推广,学生们都爱不释手,并将它比作自己的个性化导师。

根据哈佛大学的研究,将人工智能有策略地融入教学,可以给学生提供持续性的个性化支持,不仅能把整个学习过程包装的引人入胜,还能帮助真正的老师们解决不少复杂的教学难题。

不过在详细介绍之前,想必大家对AI如何改变了教育生态这个问题,了解的已经不少了。

说实话,就AI在教育领域下场这件事而言,负面的担忧并不比正面的期待要少。

之前,学生们用生成式AI替自己写作业、完成论文的事儿已经发生不少了。显然,这和教学的基本目标相悖。因此,更多老师选择的做法是,明令禁止用AI完成课程作业。

因此,为了规避这个问题,哈佛大学设置了一些防护措施,为的就是维护学术诚信,促进更有意义的学习过程。

他们还测试了专为CS50这门课开发的AI聊天机器人,以橡皮鸭的形象呈现,称为CS50 Duck(或叫CS50.ai)。

哈佛大学表示,这个系统是为了实现他们的终极目标:1:1的师生比例。

开发过程


谷歌最初追求的是简单的概念验证功能,后来逐渐才演变出更多更加高级的项目,最终目的当然是提供一套全面的工具,帮助学生学习CS50的课程。

目前,这些工具包括:

1)高亮代码解释——用于快速、易懂的代码解释

2)style50增强版——用于评估不同代码风格

3)CS50 Duck——一个通过多平台回答课程相关问题的聊天机器人。

所有这些工具都由统一网络应用程序CS50.ai提供支持。除了提供快速准确的AI生成的回复外,CS50.ai还内置了 一个叫「Pedagogical Guardrails」的东西,直译过来就是「教学围栏」,目的就是引导学生学习,而非直接提供答案。

高亮代码解释这一块,哈佛大学创建了一个VS Code的扩展,以此来模仿人类教师的行为,为学生提供某一代码片段的简要解释。

学生要做的很简单,只要选中一行或者几行代码即可。

这个东西和CS50现有的正确性测试工具Check50相辅相成,可以及时讲明白代码语义相关的问题。

这样一来,有了更加便捷和准确的代码解释,学生就可以提高学习效率,更多把目光放在更高层次的问题上,比如如何设计代码。而不是像解释代码这种稍低层次的问题。

而style50代码风格分析,不仅可以检查代码的风格,还可以帮学生改进代码。

在呈现上,最新版本的style50会将学生的初始版本和改进的版本放在一起比较,让学生更清晰地看出改在了哪里,为什么改,改完了哪儿好。

同时,学生还可以一键生成通过自然语言解释的文本,一目了然,不用自己分析。

不得不说,从交互性上看,这套系统做得是真不错。

上面提到,这套系统的后端都是由CS50.ai支持的,这样不同部分之间就有了一致性。

同时,为了让学生的体验更好,哈佛模仿ChatGPT的形式,开发了一个CS50 Duck的独立网站,一样采用对话形式,学生可以和GPT-4直接互动,如下图所示。

CS50 Duck可以通过CS50.ai的网站和单独的VS Code扩展程序两种方式使用,如下图所示。

一直以来,哈佛都使用第三方平台Ed作为其CS课程的在线讨论平台,提供教学辅助。

通过Ed,学生们可以提出问题,并接受来自工作人员和同时在学这门课的同学的指导,这样做简化了讨论,最大限度地减少了重复问题的反复提出,还促进了同学间的合作。

为了进一步完善Ed的功能,新版本中,开发人员利用CS50 Duck的HTTP请求功能将其集成到平台中,如下图所示。

聊天机器人CS50 Duck也会参与进来,并回答问题。通过在CS50.ai应用程序中为Ed上的CS50 Duck创建的一个专用API端点,开发人员就可以控制由GPT-4输出的回答,确保CS50 Duck的输出符合课程的设置和教学理念,而非简单地直接回答学生的问题。

CS50 Duck的所有回答都设置为可由人类工作人员审核,审核员可以对答案进行修改或是删除。

学生的提问首先会被转发到 CS50.ai。其中,所有涉及个人身份的信息都会被删除。然后,提问会被进一步处理成结构化的问题,成为一个prompt。

这些prompt根据特定课程的设计和指南创建,目的是为了引导 GPT-4以更高的精度生成回答,做到上下文理解「满分」。

此外,对于来自Ed平台的提问,CS50.ai在生成回复时使用了一种叫做检索增强生成(retrieval-augmented generation,RAG)的技术。

RAG利用从外部来源获取的信息和知识,提高LLM生成内容的准确性和可靠性,减少幻觉的发生。

然后,相关信息被添加到prompt中,使GPT-4能够生成更加准确且符合上下文的回答。

这么来看,CS50.ai和GPT-4相互配合,能够快速为学生提供正确而有效的回答。

还有一个非常有意思的点,值得一提。

细心的读者应该已经注意到了,上面的聊天界面的小鸭子旁边有五个小心心,其中一个还只有一半了。

有没有很熟悉,就像玩儿那种游戏的时候,人物角色旁边会出现的生命计数。

这也是这套系统的创新点之一。

CS50.ai通过可视化小心心来实现一个节流机制,每个学生一开始有10个小心心(其实是5个完整的,10个一半的),每三分钟恢复一个。

与CS50 Duck的每次互动都会消耗一个小心心,为的就是防止大量频繁的垃圾输入的行为。

从成本角度来看,这有助于降低CS50.ai的运行成本,毕竟给GPT-4发一次消息就得付一次钱嘛,买过的朋友肯定都清楚这一点。

其次,对学生来说,这套机制也是具有宝贵教学意义的。有了发送信息数量的限制,学生就得在提问之前仔细考虑自己的问题,让自己和CS50 Duck之间的互动效率和质量更高。

根本目的还是在于培养学生独立解决问题的能力和精准提出关键问题的能力,这对学习本身至关重要。

而且还能让部分学得上头的同学,停一步,慢下来好好看看自己之前学习的过程,强制性的复盘并休息一小下。

RAG是消除幻觉的关键


有关这个RAG,咱们再多说几句。

LLM有时候会产生幻觉,这个大家都知道。

之所以会出现这种情况,是因为AI模型是在大量文本数据的基础上训练出来的,因此它们学会了流畅地生成文本,而不一定重视事实的正确性。

此外,LLM有时会有一个所谓的知识截断点,这使得它们的信息仅限于在最近一次训练之前所学到的知识,而无法获得实时更新,或那次训练后新出现的内容。

而RAG就可以很好地解决这个问题。哈佛大学的开发人员利用OpenAI的嵌入式应用程序接口(Embeddings API)为CS50创建文本嵌入,从而形成一个真实的外部数据源。

这些嵌入是向量表示的(即数值),可以为机器学习算法捕捉语义,从而更有效地解释和利用数据。

整个数据准备过程包括将课程讲座的英文字幕分割成30秒的短小独立片段,然后利用OpenAI的text-embedding-ada-002模型为这些片段创建嵌入,并将结果存储在ChromaDB向量数据库中。

之后,开发人员还会为每个输入进来的来自学生的提问创建一个新的嵌入,并在向量数据库中执行嵌入搜索,以检索按相关性排序的内容。

如此一来,就最大程度地规避了幻觉的出现。

学生反馈集准确率


从使用过的学生们的反馈来看,这套系统不可谓不成功。

有同学表示,他们很喜欢人工智能机器人回答问题时的直接,既不会有包含个人情绪的评价,也不会有觉得你问题太笨蛋的优越。即使是最愚蠢的问题,它也会一视同仁地回答。

还有同学表示,在AI时代,ChatGPT不可避免的会让自己在学习的过程中偷懒。而有了个性化定制的CS50.ai,就可以既使用AI又规避过度依赖AI的问题。

而在两次校内的调查中,哈佛大学采访了差不多五百位同学,看看他们使用CS50ai的频率和使用感受。

结果显示,17%的学生每周使用这些工具十次以上,32%的学生每周使用5-10次,26%的学生每周使用2-5次,25%的学生每周使用少于两次。

此外,大多数学生认为课程的AI工具是有帮助的。从数据来看,47%的学生认为其非常有用,26%的学生认为有用,21%的学生认为有点用。不过,还有6%的学生认为没用。他们有可能还没习惯,或者是本身已经非常优秀了,不需要AI来协助自己学习。

还有不少用过的学生将CS50 Duck拟人化,把这个小动物当作自己的好朋友。哈佛大学表示,这就符合他们设计这套系统和这个形象的初衷了。

不过,上面提到的节流的小心心,有些学生还是持反对意见,觉得不受限制的提问更好一点。但哈佛大学虞姬还是不会对这个部分进行改动。

而为了评估CS50 Duck在Ed上的表现,开发人员邀请了一位不在团队中的资深开发者来审查CS50.ai生成的回复。

CS50 Duck在暑假期间,一共在Ed上发布了64条回答,其中25条与课程内容相关,其余39条与行政相关。

25个和课程内容相关的问题的回答中有22个(88%)是准确的,39个和行政问题相关的回答中有30个(77%)是准确的。

而着时间的推移,CS50这门课的教学大纲也在不断变化,这就导致了GPT-4与课程的最新变化不同步。

未来RAG会更大程度的派上用场,这套CS50.ai的系统应该也会不断进行优化。

参考资料:
https://cs.harvard.edu/malan/publications/V1fp0567-liu.pdf



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
什么样的大学教育最有成效?鼓励更多挑战、反思与合作预告 | 4月彭博终端用户专享课程,新增午休时段课程,更加灵活,更多选择!刷个B站的功夫就把Python入门了,哈佛的线上课程,太强了!CSRankings美国CS专业排名出炉!MIT跌出前5,UCSD比伯克利还牛......哈佛、斯坦福等众名校开设“霉霉”课程,这课你还逃吗?哈佛上线的Data Science课程,质量太高了假如爱的手指划过个人感慨之六十八 宪政韩国每5个孩子有1个想自杀,这部纪录片揭示了东亚教育最残酷的一面……顶尖美高3名学生相继自杀,我看到精英教育最残酷的一面82㎡二居室,「导圆角」的简约设计个人感慨之六十九 松坡将军市区South Loop房源SL02 | 不收中介费/studio 17xx起/CCC/DePaul/Roosevelt《雪豹》:心灵世界的一块拼图不愧是哈佛!这门转码“神课”终于开放2024新资源个人感慨之七十 习家帮高校辅导员:1:200的24小时“服务员”?教育部部长怀进鹏在2024世界数字教育大会上的主旨演讲:携手推动数字教育应用、共享与创新|聚焦世界数字教育大会哈佛新校长身份曝光?奥巴马或成为下一任哈佛校长哈佛新上的Machine Learning课程,质量太高了(3.24)2024 CSRankings美国「CS专业」排名!MIT跌出前5,UCSD比伯克利还牛......住斯坦福+哈佛!全美最强AI科技夏令营开启报名!绝了!哈佛新上的这门Machine Learning课程,质量太高了大英失去最后一块遮羞布?爱泼斯坦近千页保密文件解封,曝出最大猛料!电车「续航焦虑」,能指望「导航」了?外企社招丨Dräger德尔格,行业全球领导者,15薪,六险一金,多样福利,偏爱留学生给博士占星:预测「导师怎么看我」人最多刷个B站的功夫就能把Python学了,哈佛这门线上课程,太强了!报名通道|芬兰自然教育导师认证课程:本周日开课《相思》&《为你等待》来自哈佛!2024美国小姐冠军出炉,空军现役,又美又飒!张志勇:当前家庭教育最大的危机是什么?4月班报名通道|芬兰自然教育导师系统认证课程年发行10万套非常难,董宇辉4小时卖出8万多套!75年老牌文学杂志,把亲人找回来了太牛了!卷夏校卷进哈佛MIT,这届中产妈们打开了“鸡娃”新思路!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。