大家好,我是Mr.刀,一个喜欢探索AI新知的媒体人。
随着人工智能的突飞猛进,网上早已经选出了第一个被AI淘汰的的专业——语言类专业,如英文中文法语等。
比如AI软件HeyGen,只要几次点击,就可以生成和你声音一样,口型同步却可以40多种语言、多种口音的数字人。
■前段时间很火的霉霉说中文和郭德纲用英文说相声,就是用了这个软件,但也已经有人用这项天衣无缝的换脸技术实施诈骗Facebook母公司Meta构建了一个名为NLLB-200的人工智能模型,它可以翻译200种不同的语言。如下面的视频,无需文字,闽南语就可以被直接翻译成英语语音。在这种情况下,美国几大主流媒体《纽约时报》和《大西洋月刊》等都开始花了大量时间去研究,用大量篇幅来讨论:我们的孩子,还有必要花大量的时间,如此辛苦地学好一门语言吗?
其实,「有了AI不用再学外语」的论调,从去年ChatGPT横空出世的那时候就已经风靡全球。很多主流美国媒体,都开始不约而同地开始预言「英语学习即将终结」。纽约客在2023年写了一篇文章《英语专业的终结》(The End of the English Major),引用了更多数据来佐证这个现象。早在疫情之前,亚利桑那州立大学校园内英语专业的人数就已经从 953 人减少到 578 人。要知道,这所大学的师生比优于加州大学伯克利分校,拥有 71 名终身教授英语教师,其中包括 11 名莎士比亚学者,对于喜爱英语文学的学生来说,它被认为是一处福地。而且2021 年,亚利桑那州立大学英语教授获得两项普利策奖,比美国任何其他英语系都多。然而就是这样一所大学,也无法阻挡那些离开语言专业的学生。这不是个例,已经蔓延到美国全国甚至全球。目前一个非常确定的事实是:如果你只是把「学外语」作为一种沟通工具,那么有了功能越来越丰富的AI应用,你的确可以不用再苦哈哈地去学了。如今有一万种强大的AI工具,能让你在10分钟以内弄懂一种陌生语言。
比如知名音源串流平台 Spotify 正在尝试利用OpenAI的语音生成工具,以主持人自己的声音实时翻译播客的内容。还有硬件厂商三星,最近宣称其新款Galaxy S24手机具备在通话过程中实时翻译的功能。近日《大西洋月刊》上刊出了一篇《外语教育的终结》(The End of Foreign-Language Education)的评论文章,就大力夸赞了文章开头提到的AI深度伪造软件HeyGen。作者路易斯自己最近在学习中文,但现实中的她学的是磕磕碰碰,甚至很多发音和语气都不标准,但通过HeyGen,视频里的她突然能流畅的使用中文说话,交流,各种语法错误和尴尬的停顿都消失了。作者表示,虽然视频是伪造的,但这样的普通话流畅程度或许是她一辈子都无法企及的。一款写作助手APP TextCortex AI。它有一个名为 ZenoChat 的对话式 AI,可以生成超过 25 种语言,加上一个名为Zeno Assistant 的写作助手,双管齐下纠正你的语法学习和写作小错误。更好用的部分在于,你甚至可以个性化自己的语言学习体验,创建一个符合自己进度的语言AI助手,相当于一名写作私教。还有市面上的主流英语学习APP,也开始嫁接AI功能,主打能够使用机器学习的算法来分析用户的进度,并给于个性化的反馈。比如多邻国(Duolingo),由GPT4提供技术支持,学习语言的经历更像是在玩手游:有每天需要完成的任务,有玩家的排名榜单,有各种挑战和测试,以提高你的词汇量、语法和记忆力。在这样的情况下,去大学学习语言已经被预言会被淘汰了,而更惨烈的状况还在疫情后不断发生。「我感觉自己像身处在泰坦尼克号上」,这是哈佛的一位资深教授发出的感慨。■我们整理了一份实用的AI语言学习工具,获取方式放在文末了
AI对留学生的伤害
然而,一个斯坦福最新研究的结论却显示:人类在语言方面过度依赖AI,其实最先伤害的就是非英语母语者,对我们来说,就是中文母语的留学生。这个研究的主导者是生物医学数据科学助理教授 James Zou,他与团队用七种流行的GPT检测程序修改了91篇非母语者的英文论文。然而结果是,有的号称准确率99%的AI程序,却会将98%非母语者的自己写的论文标记为「由人工智能撰写」。而当学者将美国八年级学生的作文喂给同一个AI,它就正常地将90%作为判定为「由人类撰写」。学者认为,这样的偏见形成的最大原因是,非母语者写论文更倾向于用简单的词汇,而AI判定的标准正是「文本复杂性(text perplexity)」,如果AI可以轻松预判下一个单词,那么复杂性就低,就越容易被判定为是AI撰写的论文。
有意思的是,了解了隐藏的逻辑以后,学者让ChatGPT自己用更复杂的语言重写了一篇托福论文,然后再让AI去测试,结果就被标记为「来自人类撰写」了。学者非常审慎地提醒:「AI检测器对非母语人士的影响是非常严重的。无论是升学考试的学生,提交论文的学者,还是求职的年轻人,都会因此被错误地判定为用AI作弊,并将非母语者边缘化,因为Google等搜索引擎,会将它认为是AI生成的内容的降低权重」。美国名校范德堡大学去年发布了一项声明,表示禁用AI论文检测软件Turnitin。因为发现提交了7.5万篇学生论文后,大约750篇被错误地标记为其中一些是由人工智能撰写的。从非英语母语者的角度来说,在人工智能成为了必备工具的时候,如果我们没有深度学好一门语言,而是过度依赖AI,则很可能更早遇到危机。然而,事实却是人工智能已经带来全球年轻人英语能力不同程度的下降。数据显示,自 2020 年以来,美国 13 岁学生的阅读平均成绩有所下降。英孚教育的《2023年英语水平指数》报告也显示,东亚年轻人整体英语水平已经回落至2017年的水平,而且自2020年以来,中国各年龄段的英语水平均显着下降,且没有放缓的迹象。甚至被认为语言学习方面的「卷王」中国香港,18-22岁年轻人的英语水平也出现了急剧下降。■中国香港得分为558,在全球排名第29位,在亚洲排名第四,北京514分,上海512分
AI危机的另一面
回到文初的问题:那么,在这样的环境下,我们还要继续学语言吗?去年在奇幻界掀起一股热潮,并斩获重量级大奖的耶鲁毕业生华裔作家匡灵秀的《巴别塔》(Babel: An Arcane History),讲述了一个和翻译有关的故事。
故事中虚构了一个十九世纪末期的大英帝国,拥有一个被称为巴别塔的世界翻译中心,这里同时也是帝国不断征服世界的引擎。翻译外语注定不可能是完美的,巴别塔的学者们藉由将一种语言翻译到另一种语言的过程,利用白银条捕捉翻译中丢失或扭曲的含义,进而施展魔法。白银成了帝国的力量源泉,在小说中甚至促使了英国的舰队所向披靡,控制一个又一个的殖民地,甚至开启工业革命,帮助英国把全世界的白银收入囊中。巴别塔的故事主轴就是,语言以及翻译,任何语言的意思都无法百分百被翻译成另一种语言。或许回到如今的 AI 加速语言学习,让众人惊呼「外语学习已死」的情况下,还有更有趣的一层含义。在《外语教育的终结》一文中,现代语言协会(MLA)的执行董事保拉·克雷布斯 (Paula Krebs) 引用了 1991 年深受喜爱的《星际迷航:下一代》中的一集《达莫克》来表达类似的观点。企业号星舰上的船员们努力与居住在El-Adrel IV星球上的外星人塔玛利亚人进行沟通。他们可以使用「通用翻译器」,使他们能够理解塔玛利亚人的基本语法和语义,但依然「无法理解他们文化的隐喻」。一如我们确实拥有了更强大的翻译工具,但翻译并不是外语学习的全部,与其说外语的学习是从一门语言转译到另一门语言,我们更像是在重新接触一个全新的文化,以及分歧。硬币的另一面是,AI 或许正在加速语言和思维方式走向某种灭绝。华盛顿邮报于去年刊载了一篇《人工智能可能导致语言和思维方式的大规模灭绝》的评论文章,就讨论了这个问题。里面的观点是,目前所有的AI,都是经过一定文本的训练而形成的结果。当你向AI询问一个问题,与其说它们是自己「想出」答案,不如说这是经过海量的文本进行机械学习之后,获得的「预测」后「拼凑」的内容。比如一段关于早餐的文本中,如果这个模型是运用西方的文本进行训练,那么早餐就更可能是培根、鸡蛋和咖啡,而不见得是粥粉面饭这种更符合中国人饮食习惯的早餐方式。目前最强大的语言模型是接受过约20种「高资源语言」,例如英语、中文、德语、法语等大众训练出来的模型,这些语言能供给大模型进行机械学习的材料足够多。但那些小众的、资源较少的语言呢?是否会因为训练越来越少,而在不久的将来,连同它背后的文化都销声匿迹。而在遥远的未来还持续传承属于自己的文化和文明,放弃语言就意味着放弃生存权。外语教育未来应该更多的和这种语言所关联的文化相关,了解不同的文化可以极大的扩展一个人的认知和心理能力。同时,外语教育应该调整过去只集中关注在词汇、语法的掌握,聚焦在听说读写能力,而掌握一门外语更多的是需要你熟悉一种文化,一种思维和生活方式。联合国数据表明,每两周就有一种土著语言消亡。还有一项研究发现:「只有不到 5% 的语言仍能进入数字领域,有证据表明数字鸿沟导致了大规模的消亡」。在人工智能时代,工具会越来越多,外语也是一样的。可以肯定的是,如果只是去追风口,我们永远赶不上AI迭代的速度。但像《巴别塔》的作品,我们永远都缺。这或许在AI不断跃进的当下,正是我们发力的方向。■普林斯顿学姐Cindy,自己学习了全世界最珍稀的小语种北拉科塔语,并将一本著作翻译为中文,在一定程度上延续了这个濒临灭绝的语言。
本文授权转载自“谷雨星球”
邀你一起做内卷下的教育长期主义者