华人科学家李飞飞：从洗衣妹到“AI教母”

公众号新闻

2024-05-04 14:05

来源|看天下实验室

ID|vistaedulab

作者|王亚坤

为了赚钱，李飞飞在饭店刷过盘子，在干洗店打过工，整个高中和大学时代，她的衣服都是从别人丢掉的垃圾中捡的。

没人想到，这样一个贫穷的女孩，之后会成为席卷全球的AI革命的核心人物之一，甚至被誉为“AI教母”。

她的征途是星辰和大海，起点却是美国东北部的臭水沟。

16岁时，李飞飞和父母移民到美国，生活跌入谷底：一家三口挤在一个只有一间卧室的公寓里，没有积蓄，不会说英语，靠繁重的体力劳动维持生计。

这个聪明的女孩考上美国最顶尖的高校之一，却没想着毕业后挣大钱实现阶层跃迁，而是投入到当时还是“天坑”的人工智能专业中，梦想着教会机器学习，改变整个世界。

坚信数据对人工智能有重要意义的她，在只有一个助手的条件下，创建了人类历史上规模最大的标注数据集，为接下来引爆AI革命的大事件准备了舞台。

李飞飞一路走来，生在北京，长于四川，又从中国到美国，由物理专业到人工智能领域，靠着其坚强、疯狂与热爱，从一个洗衣妹跨进AI这场科技革命的中心。

48岁的李飞飞在传记中直言，父母的性格各自有一部分对她产生影响。

1976年，李飞飞出生在一个知识分子家庭。父亲是工程师，性格天真散漫。李飞飞出生那天，父亲姗姗来迟，并不是因为路上堵车或其他意外，而是因为他一时兴起，跑到公园观鸟，忘了时间。给女儿起名“飞飞”，也是观鸟时想的。

这种好奇心传染给了李飞飞，小时候，父亲常带她到公园观鸟，去田里看水牛或捕捉昆虫，激发了她对周围世界强烈的探索欲望。

母亲完全相反，对科学不感兴趣，但热爱文学，会带着女儿读鲁迅的作品以及波伏娃《第二性》、海明威《老人与海》等西方经典。

父母的共同特点是，他们对功名利禄完全不感兴趣，也从未像很多同事那样通过送礼或请客吃饭的方式讨好上级。

李飞飞记得，小学有一次校运动会，老师要求所有人穿白色衬衫，李飞飞爸爸在仔细阅读规则后，把女儿白衬衫上每个纽扣都换成彩虹色，运动会当天，在一片“白色海洋”中，李飞飞尤为显眼。

父母的教育理念和学校也有冲突。因为在期末考试前还痴迷于阅读米兰·昆德拉的《不能承受的生命之轻》，李飞飞被叫了家长。母亲听完了老师的抱怨，但没有责怪女儿。

“我把你教得太好了。”回家路上，她对李飞飞说。

和母亲期望的不同，李飞飞最爱的不是文学，而是数学。中学接触到物理后，这又成了她最痴迷的科目，连骑自行车转弯时都思考加速度和角动量的变化。她还对物理学历史上一个又一个伟大人物感兴趣，对阿基米德洗澡时发现浮力定律、牛顿在瘟疫肆虐时躲在家乡写《自然哲学的数学原理》等事件浮想联翩。

这样的日子在李飞飞16岁时戛然而止。1992年，李飞飞父亲在美国工作3年后，将她和母亲接到美国。当时，李飞飞可能想不到，她们家的生活将很快跌入谷底。

因为完全不懂英语，李飞飞父亲没能继续工程师生涯，他在一家华人开的店找到维修相机的工作，每天很晚才下班。母亲在商店找到一份收银员的工作，做重复和机械性的操作，远离了她热爱的文学作品。

日子很难捱。李飞飞的新家位于美国东北部富裕的新泽西州，一家三口挤在只有一间卧室的公寓里，家具是从路边遗弃的垃圾里捡的。

为了补贴家用，每一个不上学的日子，李飞飞都会去打零工，最常见的工作是去中餐馆打杂，每天从上午11点工作到晚上11点，总共12个小时，时薪2美元。她也做过帮人看家或遛狗的工作，时薪更高，也更清闲，但不好找。

在餐馆打杂时，趁着下午换班，李飞飞会利用难得的空隙去读母亲分享给她的文学名著，餐馆经理对此不屑一顾。“他觉得对我们这样的人来说，想象力在生活中是多余的”，李飞飞回忆称。

对这些连英语都不会说的华裔移民来说，阶层跃迁是个遥不可及的梦。

曾经引以为傲的学业也变成负担。李飞飞几乎不会说英语，每一节课，无论什么科目，对她而言都是英语课。每天回家做作业，她都要准备两本词典，一本英译中，一本中译英，否则就写不了作业。

自我表达成了一种奢望，“不会说话”的李飞飞交不到朋友，成绩也一落千丈——考试的时候，很多时候她连题目都看不懂。

幸运的是，数学和物理两门课受到的影响很小。学习它们，更多依赖数字、符号和公式。李飞飞对数学和物理的狂热也没有随着移民到美国而改变。

李飞飞家没钱付学费，３年后高中毕业时，她申请的都是公立和社区大学，只是怀着一种仪式感，顺带申请了美国顶级名校普林斯顿——李飞飞最崇拜的科学家是爱因斯坦，普林斯顿是他度过晚年的地方。

没想到，普林斯顿不愿意错过这个SAT（类似美国高考）数学考了满分的女孩，给她开出全额奖学金。

整个社区沸腾了。邻居们羡慕地设想，李飞飞会去读普林斯顿医学、工程或者金融相关专业，拿到富裕阶层的敲门砖，改变整个家庭的命运。但是，让他们大跌眼镜，李飞飞并没有进那些热门的赚钱行业，而是选择了自己痴迷的物理。

“真是张好彩票，可惜浪费了。”邻居们无法理解。

普林斯顿大学对李飞飞来说就是天堂。

普林斯顿大学校园/图源自Unsplash

她依然很穷，要从洗衣房捡别人扔掉的衣服穿，每个周末，都要回家里的干洗店帮忙。大一快结束时，李飞飞的母亲心血管疾病发作，尽管通过手术抢救了回来，但终生不能再从事全职体力劳动。李飞飞家用积蓄和借款开了家干洗店，周末客人会更多，李飞飞要回家帮忙，而且几乎不会说英语的李飞飞父母，也需要女儿做翻译。

来到美国后，李飞飞第一次有了属于自己的房间，宿舍面积甚至比一家三口蜗居的公寓还要大。更重要的是，这里是知识的殿堂，可以帮她找到那颗指引自己的“北极星”，那个可以改变世界，让她为之痴迷和奋斗的问题。

大二时，李飞飞的兴趣发生转向。当时，在阅读爱因斯坦、波尔、薛定谔等著名科学家传记后，她发现很多人在晚年转而对生命话题感兴趣，探索智慧的奥秘。在1990年代末的计算机热下，另一个问题引起了李飞飞的注意：机器可以掌握人类的智慧吗？

李飞飞就此关注到了人工智能领域。和20多年后这个行业的爆火不同，当时正值“AI寒冬”，整个领域停滞不前，缺乏突破，很难获得研究资金。这个时候入行，显然不是好时机。

李飞飞不在乎这些。大学毕业后，她选择到另一家顶级名校加州理工学院深造，两位导师分别来自计算机和神经科学专业。

就在李飞飞满怀期待开始研究生生活时，或许是嫌她吃的苦还不够多，命运又给了她一记暴击。

李飞飞母亲再次病倒，几乎完全不能再从事体力劳动，干洗店的生意难以为继。李飞飞把父母接到自己的宿舍，让母亲在天气更温暖的加州疗养，同时方便照顾他们。

母亲的病随时可能恶化，怎么挣钱给她看病？第一次，李飞飞认真考虑，放弃科研梦想，找一份薪水高的工作。

著名咨询公司麦肯锡正在加州理工学院招聘，李飞飞买了一件得体的西装。这对她来说还是过于奢侈的消费，她没有撕掉标签，而是用衣领遮住，打算面试结束后立刻退回店里。

尽管没有任何工作经验，李飞飞还是凭借才智和韧性打动了麦肯锡，他们不仅同意录用，还把原定招聘的实习生岗转成正式职工岗。

6位数年薪和健康保险近在眼前。最终，却是母亲阻止了李飞飞的决定。她至今都记得母亲当时那段拯救了她人生的话：

“飞飞，我们走到这一步，不是为了让你放弃。我了解我的女儿，她不是一个咨询顾问，她是一个科学家。”

麦肯锡失去了一位咨询顾问，已经处于谷底的人工智能领域迎来一位转折性的人物。

为了教机器像人一样识别图片中的物体，科学家们首先要搞懂，人是怎么辨识物体的。

1990年代前，主流理论认为，人眼辨识物体，是从色彩、形状、明暗等不同层次的微小细节开始，然后建立它们之间的关系，最后在大脑中形成一个完整的画面。

这符合直觉，算法的开发也试图模拟这个过程。

但是，到1990年代，这个理论遭到越来越多人质疑。科学家们通过实验发现，人类具有快速准确的图像识别能力，哪怕在集中注意力做其他事情的同时，也能对快速闪过的图像内容作出精准判断，比如“这是一幅风景画”，或者，“图片里是一只柯基犬”。

人只要看到某些细节，就能通过自己的丰富经验联想到这个物体可能是什么，并在想象中自动填充其他部分。

换言之，重要的是“类别”，人通过联想到“类别”而判断物体是什么。

李飞飞是“类别论”的支持者。她进一步想到，人是因为有丰富的阅历而能判断出类别，如果想让机器也做到这一点，就需要它们“看”过海量同一类别的图片。

创建一个由人类标注好类别的图片库，让机器学习的想法就此出现。

给机器呈现一个完整的世界，它们之后会开始尝试理解这个世界。这是李飞飞的“北极星”，她看到了数据的重要意义，在此之前，科学家们只把它当成算法的附庸。

2005年博士毕业后，李飞飞先是在伊利诺伊大学厄巴纳-香槟分校找到教职，一年后被母校普林斯顿挖走。她决心把创建数据库的想法变成现实。

这是一个过于“大胆”的想法。

几乎包含所有英文词汇的网络WordNet里有约14万个单词，其中，所有可见的物体类名词有2.2万个，如果每一个类别下配1000张图，意味着需要有约两千万张标注好的图片，规模浩大。

同事们都不看好这个项目，当时世界上最大的标注数据集，只有100个分类，图像也只有约１万张，2000万张图像太多了，算法用不了这么多数据，也没有那么强的算力去支持。

连李飞飞导师的导师，“师爷”吉腾德拉也不看好这个项目，他委婉地提醒李飞飞：“科研的诀窍是跟随你的领域一起成长，不要太超前。”这尤为让人丧气，李飞飞本打算将来申请终身教职时，请吉腾德拉写推荐信的。

她开始担心，如果继续做ImageNet，自己会失去拿终身教职的机会。

男友西尔维奥支持李飞飞的想法，他们在加州理工读博时结识，都是痴迷机器学习的书呆子性格。“你不是一直追求出格的想法吗？”西尔维奥说。

李飞飞只有一个研究生做助手，以及少得可怜的经费，这注定是一场豪赌。

外界大概很难想象，最前沿的计算机学习，最开始是个手工活儿。

他们设计出程序，可以自动依照划分好的类别从搜索引擎谷歌上一天24小时不停下载图片。在电脑网络IP被谷歌识别和封杀后，他们又想出了设置动态IP的办法。

一共有几十亿张图片被下载，接下来需要剔除那些画质不高、重复或者不相关的图片，然后手工标注这些图片。

李飞飞请普林斯顿大学本科生们来做兼职标注，每小时10美元，但速度慢得惊人，按这个进度，要18年才能完成。

李飞飞想，自己那时可能已经被普林斯顿开除了。扩张预算、招更多学生来做标注也不现实，工作又陷入死胡同。

“众包”拯救了他们。一次偶然的机遇，李飞飞听说网络购物平台亚马逊上可以发布“众包”任务，立刻想到，中国、越南等地人力成本明显低于普林斯顿的本科生，如果把标注任务外包出去呢？

他们成了“众包”业务早期最大的买家之一。最终在全世界167个国家的4.8万名标注员的共同努力下，仅用了1年时间，这个被命名为ImageNet的图片库就得以问世，这是人类历史上规模最大的标注数据库，和神经网络AlexNet一起，它们将引爆2012年的AI革命。

ImageNet是一个不被看好的项目，即便成功问世，也鲜有人使用——科学家们普遍还没有意识到数据的威力。

为了推广ImageNet，2009年，李飞飞组织了迄今为止AI历史上最成功的赛事：ImageNet大规模视觉识别挑战赛。参赛团队可以免费使用ImageNet图像库，但需要自行开发算法，最终以图像识别准确率高低来决定名次。

李飞飞传记《我看到的世界》

最开始两届很难说是成功，参赛队伍数量一般，算法识别准确率也没有革命性突破。

事情在2012年迎来转机。这一年，有“AI教父”美誉的杰弗里·辛顿和其学生开发的神经网络AlexNet在挑战赛中一举夺魁，并且把识别准确率提高了整整10个百分点。

人工神经网络一战成名。更让科学家惊喜的是，他们意识到，如果不停增加神经网络的层次，识别准确率还会继续提高，这是“深度学习”的含义。

让机器具备像人一样“看”的能力，历史上第一次变成现实。

更重要的是，用大数据训练多层神经网络的想法，从图像扩展到语音、文字、视频等其他领域，引爆了持续到现在的AI革命。2014年，机器人脸识别准确率已超越人类，突破落地门槛；3年后，AlphaGo横空出世，战胜围棋世界冠军李世石；2022年，ChatGPT的问世更是让整个世界意识到了人工智能的潜力。

这一切的起点和技术基础，是李飞飞的ImageNet和2012年的AlexNet。

李飞飞就此享誉世界。荣誉、地位、金钱潮水般向她涌来，她拿到了斯坦福大学的终身教职，当选美国工程院院士，成为谷歌云计算部门的首席科学家。李飞飞和西尔维奥结了婚，有了孩子，和自己的父母生活在一起，不用再为钱担心。

给机器呈现整个世界曾经是她的“北极星”，让她为之痴迷并前行，她做到了，现在，到了要寻找下一颗“北极星”的时候。毕竟，每个人都有仰望星空的权利，无论是在臭水沟还是已经爬上了山巅。

* 主要资料来源：李飞飞传记《我看到的世界》，

中文版由中信出版集团出版。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章