Redian新闻
>
2012,改变人类命运的 180 天

2012,改变人类命运的 180 天

公众号新闻
伟大是
如何
诞生的?


本文经授权转自《远川研究所》;作者:李墨天,编辑:戴老板

2012 年 12 月初的一天,一场秘密竞拍正在美国滑雪胜地太浩湖(Lake Tahoe)的一家赌场酒店里进行。
太浩湖位于加州和内华达州交界处,是北美最大的高山湖泊,拥有蓝宝石般的湖面和顶级雪道,《教父 2》曾在这里取景,马克吐温曾在此地流连忘返,而由于离旧金山湾区只有 200 多英里,这里常被称为「硅谷后花园」,扎克伯格和拉里·埃里森等大佬也在此圈地占山,兴建豪宅。
秘密竞拍的对象,是一家刚刚成立 1 个月、仅有 3 名员工的公司——DNNresearch,创立者是多伦多大学教授杰夫·辛顿(Geoffrey Hinton)和他两名学生。
这家公司没有任何有形的产品或资产,但追求者的身份暗示出了它的分量——四位买家分别是 Google、微软、DeepMind 和百度。
举行秘密竞拍的 Harrah’s 酒店,太浩湖,2012 年
65 岁的辛顿苍老,瘦削,饱受腰椎间盘的疼痛,他坐在酒店 703 房间的地板上为竞拍设置规则——起价 1200 万美元,抬价单位至少 100 万美元。
几个小时后,竞拍者就把价格推到了 4400 万美元,辛顿有些头晕,「感觉我们像是在拍电影」,于是果断喊停,并决定把公司卖给最后的喊价者——Google。
有意思的是,这场 4400 万美元竞拍的源头之一,就是来自于 6 个月前的 Google。
2012 年 6 月,Google 研究部门 Google Brain 公开了 The Cat Neurons 项目(即「谷歌猫」)的研究成果。这个项目简单说就是用算法在 YouTube 的视频里识别猫,它由从斯坦福跳槽来 Google 的吴恩达发起,拉上了 Google 传奇人物 Jeff Dean 入伙,还从 Google 创始人 Larry Page 那里要到了大笔的预算。
谷歌猫项目搭建了一个神经网络,从 YouTube 上下载了大量的视频,不做标记,让模型自己观察和学习猫的特征,然后动用了遍布 Google 各个数据中心的 16000 个 CPU 来进行训练(内部以过于复杂和成本高为由拒绝使用 GPU),最终实现 74.8% 的识别准确率。这一数字震惊业界。
吴恩达在「谷歌猫」项目临近结束前激流勇退,投身自己的互联网教育项目,临走前他向公司推荐了辛顿来接替他的工作。面对邀请,辛顿表示自己不会离开大学,只愿意去 Google「待一个夏天」。由于 Google 招聘规则的特殊性,时年 64 岁的辛顿成为了 Google 历史上最年长的暑期实习生。
辛顿从 80 年代开始就战斗在人工智能的最前线,作为教授更是桃李满门(包括吴恩达),是深度学习领域的宗师级人物。因此,当他了解了「谷歌猫」项目的技术细节后,他马上就看到了项目成功背后的隐藏缺陷:「他们运行了错误的神经网络,并使用了错误的计算能力。」
同样的任务,辛顿认为自己可以做的更好。于是在短暂的「实习期」结束后,他马上投入行动。
辛顿找来了自己的两个学生——Ilya Sutskever 和 Alex Krizhevsky,两人都是出生于苏联的犹太人,前者极具数学天赋,后者擅长工程实现,三人密切配合后创建了一个新神经网络,然后马上参加了 ImageNet 图像识别比赛(ILSVRC),最后以惊人的 84% 识别准确率夺得冠军 。
2012 年 10 月,辛顿团队在佛罗伦萨举行的计算机视觉会议上介绍了冠军算法 AlexNet,相比谷歌猫用了 16000 颗 CPU,AlexNet 只用了 4 颗英伟达 GPU,学术界和产业界彻底轰动,AlexNet 的论文成为计算机科学史上最有影响力的论文之一,目前被引次数已经超过 12 万,而谷歌猫则被迅速遗忘。
DNNresearch 公司三人组
曾拿过第一届 ImageNet 大赛冠军的余凯读完论文后异常兴奋,「像触电了一样」。余凯是一名出生于江西的深度学习专家,刚从 NEC 跳去百度,他马上给辛顿写邮件,表达了合作的想法,辛顿欣然同意,并索性把自己和两名学生打包成一家公司,邀请买家竞拍,于是便有了开头的那一幕。
拍卖落槌后,一场更大的竞赛展开了:Google 乘胜追击,2014 年又把 DeepMind 收入囊中,「天下英雄尽入彀中」;而 DeepMind 则在 2016 年推出了 AlphaGo,震惊全球;输给 Google 的百度则下定决心押注 AI,十年投入千亿,余凯后来帮百度请来了吴恩达,他自己则在几年后离职创办了地平线。
微软表面上看慢了一拍,但最终却赢下了最大的战利品——OpenAI,后者的创始人就包括辛顿两个学生之一的 Ilya Sutskever。而辛顿自己则一直在 Google 待到 2023 年,期间荣获 ACM 图灵奖。当然,跟 Google 的 4400 万美元比(辛顿分得 40%),图灵奖的 100 万美元奖金就显得像是零花钱了。
从 6 月的谷歌猫,到 10 月的 AlexNet 论文,再到 12 月的太浩湖竞拍,差不多 6 个月的时间里,AI 浪潮的伏笔几乎被全部埋下——深度学习的繁荣、GPU 和英伟达的崛起、AlphaGo 的称霸、Transformer 的诞生、ChatGPT 的横空出世……硅基盛世的宏大乐章奏响了第一个音符。
2012 年从 6 月到 12 月的 180 天,碳基人类的命运被永远改变了——只有极少人意识到了这一点。
液体猫
在这些极少数人中,斯坦福大学教授李飞飞是其中之一。
2012 年,当辛顿参加 ImageNet 比赛结果出炉时,刚生完孩子的李飞飞还在休产假,但辛顿团队的错误率让她意识到历史正在被改写。作为 ImageNet 挑战赛的创办者,她买了当天最后一班飞机飞往佛罗伦萨,亲自为辛顿团队颁奖 [2]。
李飞飞出生于北京,在成都长大,16 岁时随父母移民美国,一边在洗衣店帮忙,一边读完普林斯顿。2009 年李飞飞进入斯坦福担任助理教授,研究方向是计算机视觉与机器学习,这个学科的目标是让计算机能够像人一样,自己理解图片和影像的含义。
比如,当照相机拍下一只猫时,它只是通过传感器把光线转化成了像素,并不知道镜头里的东西是猫还是狗。如果把照相机比做人类的眼睛,计算机视觉解决的问题就是给照相机装上人的大脑。
传统的方式是将现实世界中的事物抽象为数学模型,比如将猫的特征抽象为简单的几何图形,就能大幅度降低机器识别的难度。
图片来源:李飞飞的 TED 演讲
但这种思路有非常大的局限性,因为猫很有可能是这样的:
为了让计算机能够识别「液体猫」,杰夫·辛顿、杨立昆(Yann LeCun)等一大批深度学习先驱从 80 年代就开始了探索。但总会撞到算力或算法的瓶颈——好的算法缺少足够的算力驱动,算力需求小的算法难以满足识别精度,无法产业化。
如果解决不了「液体猫」的问题,深度学习的性感就只能停留在理论层面,自动驾驶、医疗影像、精准广告推送这些产业化场景就只是空中楼阁。
简单来说,深度学习的发展需要算法、算力、数据三驾马车来拉动,算法决定了计算机用什么方式识别事物;但算法又需要足够大的算力来驱动;同时,算法的提升又需要大规模高质量的数据;三者相辅相成,缺一不可。
2000 年后,尽管算力瓶颈伴随芯片处理能力的突飞猛进逐步消除,但主流学界对深度学习路线仍旧兴趣寡然。李飞飞意识到,瓶颈可能不是算法本身的精度,而在于缺乏高质量、大规模的数据集。
李飞飞的启发来自三岁孩子认识这个世界的方式——以猫为例,孩子会在大人的教导下一次又一次遇见猫,逐渐掌握猫的含义。如果把孩子的眼睛当作照相机,眼球转动一次等于按一次快门,那么,一个三岁的孩子就已经拍摄了上亿张照片。
把这个方法套在计算机上,假如给计算机不停的看包含猫和其他动物的图片,同时在每张图片背后写下正确答案。计算机每看一次图片,就和背面的答案核对一次。那么只要次数够多,计算机就有可能像孩子一样掌握猫的含义。
唯一需要解决的问题就是:上哪找那么多写好答案的图片?
李飞飞在 2016 年来到中国,宣布谷歌 AI 中国中心成立
这就是 ImageNet 诞生的契机。当时,即便是最大规模的数据集 PASCAL,也只有四个类别总共 1578 张图片,而李飞飞的目标是创建一个包含几百个类别总共上千万张的数据集。现在听起来似乎不难,但要知道那是 2006 年,全球最流行的手机还是诺基亚 5300。
依靠亚马逊众包平台,李飞飞团队解决了人工标注的庞大工作量。2009 年,包含 320 万张图片的 ImageNet 数据集诞生。有了图片数据集,就可以在此基础上训练算法,让计算机提升识别能力。但相比三岁孩子的上亿张照片,320 万的规模还是太少了。
为了让数据集不断扩充,李飞飞决定效仿业内流行的做法,举办图片识别大赛,参赛者自带算法识别数据集中的图片,准确率最高者获胜。但深度学习路线在当时并不是主流,ImageNet 一开始只能「挂靠」在欧洲知名赛事 PASCAL 下面,才能勉强凑够参赛人数。
到了 2012 年,ImageNet 的图片数量扩大到了 1000 个类别总共 1500 万张,李飞飞用 6 年时间补足了数据这块短板。不过,ILSVRC 的最好成绩错误率也有 25%,在算法和算力上,依然没有表现出足够的说服力。
这时,辛顿老师带着 AlexNet 和两块 GTX580 显卡登场了。
卷积
辛顿团队的冠军算法 AlexNet,采用了一种名叫卷积神经网络(Convolutional Neural Networks,简称 CNN)的算法。「神经网络」在人工智能领域是个极其高频的词汇,也是机器学习的一个分支,其名称和结构都取材自人脑的运作方式。
人类辨识物体的过程是瞳孔先摄入像素,大脑皮层通过边缘和方位做初步处理,然后大脑通过不断的抽象来判定。因此,人脑可以根据一些特征就能判别出物体。
比如不用展示整张脸,大部分人都能认出下图中的人是谁:
神经网络其实就是模拟人脑的识别机制,理论上人脑能够实现的智能计算机也能实现。相较 SVM、决策树、随机森林等方法,只有模拟人脑,才能处理类似「液体猫」和「半个特朗普」这种非结构化数据。
但问题是,人脑约有 1000 亿个神经元,神经元之间的节点(也就是突触)更是多达万亿,组成了一个无比复杂的网络。作为对比,用了 16000 个 CPU 组成的「谷歌猫」,内部共有 10 亿个节点,而这已经是当时最复杂的计算机系统了。
这也是为什么连「人工智能之父」Marvin Minsky 都不看好这条路线,在 2007 年出版新书《The Emotion Machine》时,Minsky 依然表达了对神经网络的悲观。为了改变主流机器学习界对人工神经网络的长期的消极态度,辛顿干脆将其改名为深度学习(Deep Learning)。
2006 年,辛顿在 Science 上发表了一篇论文,提出了「深度信念神经网络(DBNN)」的概念,给出了一种多层深度神经网络的训练方法,被认为是深度学习的重大突破。但辛顿的方法需要消耗大量的算力和数据,实际应用难以实现。
深度学习需要不停的给算法喂数据,当时的数据集规模都太小了,直到 ImageNet 出现。
ImageNet 的前两届比赛里,参赛团队使用了其他的机器学习路线,结果都相当平庸。而辛顿团队在 2012 年采用的卷积神经网络 AlexNet,改良自另一位深度学习先驱杨立昆(Yann LeCun),其在 1998 年提出的 LeNet 让算法可以提取图像的关键特征,比如特朗普的金发。
同时,卷积核会在输入图像上滑动,所以无论被检测物体在哪个位置,都能被检测到相同的特征,大大减少了运算量。
AlexNet 在经典的卷积神经网络结构基础上,摒弃了此前的逐层无监督方法,对输入值进行有监督学习,大大提高了准确率。
比如下图中右下角的图片,AlexNet 其实并没有识别出正确答案(马达加斯加猫),但它列出的都是和马达加斯加猫一样会爬树的小型哺乳动物,这意味着算法不仅可以识别对象本身,还可以根据其他物体进行推测 [5]。
图片来源:AlexNet 论文
而产业界感到振奋的是,AlexNet 有 6000 万个参数和 65 万个神经元,完整训练 ImageNet 数据集至少需要 262 千万亿次浮点运算。但辛顿团队在一个星期的训练过程中,只用了两块英伟达 GTX 580 显卡。
GPU
辛顿团队拿到冠军后,最尴尬的显然是 Google。
据说 Google 在内部也做了 ImageNet 数据集的测试,但识别精度远远落后于辛顿团队。考虑到 Google 拥有业界无法企及的硬件资源,以及搜索和 YouTube 的庞大数据规模,Google Brain 更是领导钦点特事特办,其结果显然不具备足够的说服力。
如果没有这种巨大的反差,深度学习可能也不会在短时间内震撼业界,得到认可和普及。产业界感到振奋的原因在于辛顿团队只用了四块 GPU,就能达到这么好的效果,那么算力就不再是瓶颈。
算法在训练时,会对神经网络每层的函数和参数进行分层运算,得到输出结果,而 GPU 恰好有非常强的并行运算能力。吴恩达在 2009 年的一篇论文中其实证明了这一点,但在和 Jeff Dean 运行「谷歌猫」时,他们还是用了 CPU。后来 Jeff Dean 专门订购了 200 万美元的设备,依然不包括 GPU[6]。
辛顿是极少数很早就意识到 GPU 之于深度学习巨大价值的人,然而在 AlexNet 刷榜之前,高科技公司普遍对 GPU 态度不明。
2009 年,辛顿曾受邀去微软做一个语音识别项目的短期技术顾问,他建议项目负责人邓力购买最顶级的英伟达 GPU,还要搭配对应的服务器。这个想法得到了邓力的支持,但邓力的上司 Alex Acero 认为这纯属乱花钱 [6],「GPU 是用来玩游戏的,而不是用来做人工智能研究的。」
邓力
有趣的是,Alex Acero 后来跳槽去了苹果,负责苹果的语音识别软件 Siri。
而微软对 GPU 的不置可否显然让辛顿有些火大,他后来在一封邮件里建议邓力购买一套设备,而自己则会买三套,并且阴阳怪气的说 [6]:毕竟我们是一所财力雄厚的加拿大大学,不是一家资金紧张的软件销售商。
但在 2012 年 ImageNet 挑战赛结束后,所有人工智能学者和科技公司都对 GPU 来了个 180 度大转弯。2014 年,Google 的 GoogLeNet 以 93% 的识别准确率夺冠,采用的正是英伟达 GPU,这一年,所有参赛团队 GPU 的使用数量飙升到了 110 块。
这届挑战赛之所以被视为「大爆炸时刻」,在于深度学习的三驾马车——算法、算力、数据上的短板都被补足,产业化只剩下了时间问题。
算法层面,辛顿团队发表的关于AlexNet的论文,成为计算机科学领域被引用次数最多的论文之一。原本百家争鸣的技术路线成了深度学习一家独大,几乎所有的计算机视觉研究都转向了神经网络。
算力层面,GPU超强并行计算能力与深度学习的适应性迅速被业界认可,六年前开始布局CUDA的英伟达成为了最大的赢家。
数据层面,ImageNet 成为图像处理算法的试金石,有了高质量的数据集,算法识别精度日行千里。2017 年最后一届挑战赛,冠军算法的识别准确率达到 97.3%,超过了人类。
2012 年 10 月底,辛顿的学生 Alex Krizhevsky 在意大利佛罗伦萨的计算机视觉会议上公布了论文。然后,全世界的高科技公司开始不计成本地两件事:一是买光英伟达的显卡,二是挖光大学里的 AI 研究员。
太浩湖的 4400 万美元,给全球的深度学习大神做了一次重新定价。
夺旗
从公开可查的信息看,当时还在百度的余凯的确是第一个来挖辛顿的人。
当时,余凯在百度担任百度多媒体部的负责人,也就是百度深度学习研究院(IDL)的前身。在收到余凯的邮件后,辛顿很快就回复说同意合作,顺带提出了希望百度提供一些经费的愿望。余凯问具体数字,辛顿表示 100 万美元就够——这个数字低到令人难以置信,只能雇两个 P8。
余凯向李彦宏请示,后者爽快地答应。余凯回复没问题后,辛顿可能感受到了产业界的饥渴,就询问余凯是否介意自己问问其他家,比如 Google。余凯后来在回忆道 [6]:
「我当时有点儿后悔,猜我可能回答得太快了,让辛顿意识到了巨大的机会。但是,我也只能大度地说不介意。」
最终百度跟辛顿团队失之交臂。但对于这个结果,余凯并非没有心理准备。因为一方面辛顿有严重的腰椎间盘健康问题,不能开车,也不能坐飞机,很难承受跨越太平洋的中国之旅;另一方面,辛顿有太多的学生和朋友在 Google 工作了,双方渊源太深,其他三家本质上就是在陪标。
如果说 AlexNet 的影响还集中在学术圈的话,那么太浩湖的秘密拍卖则彻底震惊了产业界——因为 Google 在全球科技公司的眼皮子底下,花了 4400 万美元买了一家成立不到一个月、没有产品、没有收入,只有三个员工和几篇论文的公司。
最受刺激的显然是百度,虽然在拍卖上折戟,但百度管理层亲眼目睹了 Google 如何不惜代价投资深度学习,促使百度下定决心投入,并在 2013 年 1 月的年会上宣布成立深度学习研究院 IDL。2014 年 5 月,百度请来了「谷歌猫」项目的关键人物吴恩达,2017 年 1 月,又请来了离开微软的陆奇。
而 Google 在拿下辛顿团队后再接再厉,在 2014 年以 6 亿美元买下了当年的竞拍对手 DeepMind。
当时,马斯克向 Google 创始人 Larry Page 推荐了自己投资的 DeepMind,为了能带上辛顿一起去伦敦验验成色,Google 团队还专门包了架私人飞机,并且改造了座椅,解决辛顿不能坐飞机的问题 [6]。
「英国选手」DeepMind 在围棋比赛上战胜了李世石,2016 年
和 Google 争夺 DeepMind 的是 Facebook。当 DeepMind 花落 Google 后,扎克伯格转而挖来了「深度学习三巨头」之一的杨立昆。为了将杨立昆纳入麾下,扎克伯格答应了他许多苛刻要求,比如 AI 实验室设立在纽约,实验室与产品团队完全划清界限,允许杨立昆继续在纽约大学任职等等。
2012 年 ImageNet 挑战赛后,人工智能领域面临着非常严重的「人才供需错配」问题:
由于推荐算法、图像识别、自动驾驶这些产业化空间被迅速打开,人才需求量暴增。但由于长期不被看好,深度学习的研究者是个很小的圈子,顶级学者更是两只手数得过来,供给严重不足。
这种情况下,如饥似渴的科技公司只能购买「人才期货」:把教授挖过来,然后等他们把自己的学生也带进来。
杨立昆加入 Facebook 后,先后有六名学生追随他入职。准备在造车上跃跃欲试的苹果挖来了辛顿的学生 Ruslan Salakhutdinov,担任苹果首任 AI 总监。就连对冲基金 Citadel 也加入了抢人大战,挖走了当年和辛顿搞语音识别、后来还代表微软参与秘密竞拍的邓力。
此后的历史我们再清楚不过:人脸识别、机器翻译、自动驾驶等产业化场景日行千里,GPU 订单雪花一般飘向圣克拉拉的英伟达总部,人工智能的理论大厦也在日复一日的浇筑。
2017 年,Google 在论文《Attention is all you need》里提出 Transformer 模型,开启了如今的大模型时代。几年后,ChatGPT 横空出世。
而这一切的诞生,都可以追溯到 2012 年的 ImageNet 挑战赛。
那么,推动 2012 年「大爆炸时刻」诞生的历史进程,又是在哪一年显现的呢?
答案是 2006 年。

伟大
在 2006 年之前,深度学习的现状可以借用开尔文男爵的那句名言来概括:深度学习的大厦已经基本建成了,只不过在阳光灿烂的天空下,漂浮着三朵小乌云。
这三朵小乌云就是算法、算力和数据。
正如前文所说,由于模拟了人脑的机制,深度学习是一种在理论上非常完美的方案。但问题在于,无论是它需要吞噬的数据,还是需要消耗的算力,在当时都是一个科幻级别的规模,科幻到学术界对深度学习的主流看法是:脑子正常的学者不会研究神经网络。
但 2006 年发生的三件事改变了这一点:
辛顿和学生 Salakhutdinov(就是后来去苹果的那位)在 Science 上发表了论文 Reducing the dimensionality of data with neural networks,第一次提出了有效解决梯度消失问题的解决方案,让算法层面迈出了一大步。
Salakhutdinov(左一)与辛顿(中),2016 年
斯坦福大学的李飞飞意识到,如果数据规模难以还原现实世界的原貌,那么再好的算法也很难通过训练达到「模拟人脑」的效果。于是,她开始着手搭建 ImageNet 数据集。
英伟达发布 Tesla 架构的新款 GPU,并随之推出 CUDA 平台,开发者利用 GPU 来训练深度神经网络的难度大幅度降低,望而生畏算力门槛被砍掉了一大截。
这三件事的发生吹散了深度学习上空的三朵乌云,并在 2012 年的 ImageNet 挑战赛上交汇,彻底改写了高科技产业乃至整个人类社会的命运。
但在 2006 年,无论是杰夫·辛顿、李飞飞、黄仁勋,还是其他推动深度学习发展的人,显然都无法预料人工智能在此后的繁荣,更不用说他们所扮演的角色了。
Hinton 和 Salakhutdinov 的论文
时至今日,AI 为核心驱动的第四次工业革命又开启了,人工智能的演进速度只会越来越快。如果说我们能得到多少启发,也许不外乎以下三点:
1. 产业的厚度决定创新的高度。
ChatGPT 横空出世时,「为什么又是美国」的声音此起彼伏。但如果把时间拉长,会发现从晶体管、集成电路,到 Unix、x86 架构,再到如今的机器学习,美国学界和产业界几乎都是领跑者的角色。
这是因为,虽然关于美国「产业空心化」的讨论不绝于耳,但以软件为核心的计算机科学这门产业,不仅从未「外流」到其他经济体,反而优势越来越大。至今 70 多位 ACM 图灵奖的获得者,几乎全部是美国人。
吴恩达之所以选择 Google 合作「谷歌猫」项目,很大程度上是因为只有 Google 拥有算法训练所需要的数据和算力,而这又建立在 Google 强大的盈利能力的基础上。这就是产业厚度带来的优势——人才、投资、创新能力都会向产业的高地靠拢。
中国在自身的优势产业里,也在体现出这种「厚度优势」。当前最典型的就是新能源车,一边是欧洲车企包机来中国车展拜师新势力,一边是日本车企高管频繁跳槽到比亚迪——图什么呢?显然不是只图能在深圳交社保。
2. 越是前沿的技术领域,人才的重要性越大。
Google 之所以愿意花 4400 万美元买下辛顿的公司,是因为在深度学习这样的前沿技术领域,一个顶级学者的作用,往往大过一万个计算机视觉专业的应届生。假如当时竞拍成功的是百度或微软,人工智能的发展脉络可能都会被改写。
这种「为了你买下整个公司」的行为,其实非常常见。苹果自研芯片的关键阶段,顺手买了一家 PASemi 的小公司,就是为了把芯片架构大神 Jim Keller 挖到手——苹果的 A4、AMD 的 Zen、特斯拉的 FSD 芯片,都得到了 Jim Keller 的技术扶贫。
这也是产业竞争力带来的最大优势——对人才的吸引力。
「深度学习三巨头」没有一个是美国人,AlexNet 这个名字来自辛顿的学生 Alex Krizhevsky,他出生在苏联治下的乌克兰,在以色列长大,来加拿大读书。更不用说如今还活跃在美国高科技公司的众多华人面孔。
3. 创新的难度在于,如何面对不确定性。
除了「人工智能之父」Marvin Minsky 反对深度学习之外,另一个知名深度学习反对者是加州大学伯克利分校的 Jitendra Malik,辛顿和吴恩达都被他冷嘲热讽过。李飞飞在搭建 ImageNet 时也曾咨询过 Malik,后者给她的建议是:Do something more useful(做点更有用的事)。
李飞飞 Ted 演讲
正是这些行业先驱的不看好,导致深度学习经历了数十年的万马齐喑。即便到了 2006 年辛顿撕开了一束曙光,三巨头的另一位杨立昆还在反复向学术界证明「深度学习也有研究价值」。
杨立昆从 80 年代就开始研究神经网络,在贝尔实验室期间,杨立昆就和同事设计了一种名叫 ANNA 的芯片,试图解决算力问题。后来 AT&T 由于经营压力要求研究部门「赋能业务」,杨立昆的回答是「我就是要研究计算机视觉,有本事你解雇我」。最终求锤得锤,喜提 N+1[6]。
任何前沿技术领域的研究者都必须面对一个问题——如果这个东西做不出来怎么办?
从 1972 年进入爱丁堡大学算起,辛顿在深度学习的前线已经鏖战了 50 年。2012 年 ImageNet 挑战赛举办时,他已经 65 岁了。很难想象他在漫长的时间里面对学术界的种种质疑,需要消解多少自我怀疑与否定。
如今我们知道,2006 年的辛顿已经坚持到了黎明前最后的黑暗,但他自己也许并不知道这一点,更不用说整个学术界和产业界。就像 2007 年 iPhone 发布时,大多数人的反应可能和时任微软 CEO 鲍尔默是一样的:
目前,iPhone 依然是世界上最贵的手机,而且没有键盘
推动历史的人,往往猜不到自己在历史进程中的坐标。
伟大之所以为伟大,不是因为其横空出世时的惊艳,而是因为它要在无边黑暗中,忍受漫长的籍籍无名与不被理解。直到多年之后,人们才能顺着这些标尺,感叹那时群星璀璨,天才辈出。
一个又一个科学研究的领域里,无数的学者终其一生都不曾窥见希望的微光。因而从某种角度看,辛顿和其他深度学习推动者是幸运的,他们创造了伟大,间接推动了产业界一个又一个成功。
资本市场会给成功定一个公允的价格,历史则记录那些创造伟大的孤独和汗水。


参考资料

[1] 16000 台电脑一起找猫,纽约时报

[2] Fei-Fei Li’s Quest to Make AI Better for Humanity,Wired

[3] 李飞飞的 TED 演讲

[4] 21 秒看尽 ImageNet 屠榜模型,60+模型架构同台献艺,机器之心

[5] 卷积神经网络的「封神之路」:一切始于 AlexNet,新智元

[6] 深度学习革命,凯德·梅茨

[7] To Find AI Engineers, Google and Facebook Hire Their Professors,The Information

[8] 深度学习三十年创新路,朱珑

[9] ImageNet 这八年:李飞飞和她改变的 AI 世界,量子位

[10] DEEP LEARNING: PREVIOUS AND PRESENT APPLICATIONS,Ramiro Vargas

[11] Review of deep learning: concepts, CNN architectures, challenges, applications, future directions,Laith Alzubaidi 等

[12] Literature Review of Deep Learning Research Areas,Mutlu Yapıcı等

[13] ChatGPT 背后真正的英雄:OpenAI 首席科学家 Ilya Sutskever 的信仰之跃,新智元

[14] 10 years later, deep learning ‘revolution’ rages on, say AI pioneers Hinton, LeCun and Li,Venturebeat

[15] From not working to neural networking,经济学人

[16] Huge「foundation models」are turbo-charging AI progress,经济学人

[17] 2012: A Breakthrough Year for Deep Learning,Bryan House

[18] 深度学习:人工智能的「神奇魔杖」,安信证券

[19] 深度学习算法发展: 从多样到统一 ,国金证券


编辑:戴老板

视觉设计:疏睿

责任编辑:李墨天

研究支持:陈彬、陈畅


在小红书,什么都可以成为「生活方式」


马斯克最好的一面和最坏的一面,如何交织在一起?


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
改变命运,不过是改变我们的念头国新办举行《携手构建人类命运共同体:中国的倡议与行动》白皮书 新闻发布会图文实录靠考学改变命运的我,该如何与孩子的低分和解?奥本海默:打开人类命运“潘多拉魔盒”的人《生命之恋》&《思慕》全文发布:《共建“一带一路”:构建人类命运共同体的重大实践》我一哥们儿,180,八块腹肌,韩国欧巴面容,大厂年薪30万。在湾区找不到女朋友第八章 现代社会的诞生 (3)5129 血壮山河之武汉会战 信罗战役 2见证历史!日本核污水排海!1200天后抵达北美,拿全人类命运做赌注,持续倾倒30年恐污染全世界!赌上全人类命运!日本福岛核废水排放入海!一文看各国态度及应对措施苏炜| 改变我命运的“龙泉宝剑”是什么15种改变你命运的黄金思维方式电影《汉娜·阿伦特》(Hannah Arendt 2012)我在厂里写下的文字,改变了我的命运|人间日本核污水排海!拿全人类命运做赌注,持续倾倒30年恐污染全世界[预约] 病毒是如何改变人类历史的?DeepMind创始人:生成式AI只是过渡,AI未来将获得自由,交互式AI将改变人类特辑 | 人生改变从更新迭代底层逻辑,做命运的导演开始靠考学改变命运的我,该如何与孩子的低分和解?| 人间英国学者:构建人类命运共同体,谱写人类未来新篇章改变别人是内耗,改变自己是成长《共建“一带一路”:构建人类命运共同体的重大实践》白皮书发布重大发现!美国大学研究称“长寿基因可移植”,或将改变人类寿命郁金香,君子兰,到元宇宙,总有一款适合你显示屏,改变生活改变你我这位老人曾说过一句话,改变了一代人的命运36氪暗涌·2023产业未来大会圆满举办:和命运的齿轮一起转动2012,改变人类命运的180天宇宙人(1393期)阿丽亚娜6完成热点火测试;台积电新动向;马斯克称OpenAI新董事会关乎人类命运;大变局 | 构建人类命运共同体,需中美承担共同但有区别的责任和命运的齿轮一起转动|暗涌·2023产业未来大会1800亿参数,性能碾压Llama 2,世界最强开源大模型Falcon 180B发布​改变无数人命运的奇书,火了300多年,细节放大令人叫绝!孩子一生有4次改变命运的机会,为孩子抓住一次也好!见证历史…日本核污水今日排海!拿全人类命运做赌注,持续倾倒30年恐污染全世界悲歌一曲哀李煜 - 兼談海外從政
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。