ACM Fellow 郭宗杰:36年培养160余位博士,3/4反哺工业界!
点击下方卡片,关注“CVer”公众号
AI/CV重磅干货,第一时间送达
转载自:AI科技评论
作者丨董子博
编辑丨岑峰
“我觉得,真的要做一个科学家,在某些方面,还是要有一些心中的理想。”在与AI科技评论的对话中,今年一月受选成为ACM Fellow 的郭宗杰教授如是说。
如果要评价学者郭宗杰,他的履历绝对令人信服:南加州大学电子工程与计算机科学杰出教授,William M. Hogue讲席教授,新晋ACM Fellow,IEEE Fellow,多册学术期刊的主编和编辑,美国国科学会年轻学者研究奖、美国总统教授学者奖等多项大奖的获得者——任何一个title,在学界都说得上举足轻重。
在他关注的视觉计算、视觉传输、机器学习、大数据分析与人工智能领域,郭宗杰参与发表的千余篇学术著作,被引用超过四万次,很大程度上引领了相关领域的研究方向。
一方面,郭宗杰在多媒体、通讯和网路的部分研究深入,通过分析运动向量在时空上的关联性,提出了快速移动估算演算法,提升了近百倍的计算速度。而他在压缩技术、多媒体传输等领域的研习,也相当权威。
一方面,郭宗杰是小波理论应用的先锋,他利用小波理论,完成了质地分析、曲线描述、碎形分析和合成的工作;又利用树状结构小波转换,在图形识别领域完成了重大的突破。
另一方面,郭宗杰在多媒体内容及版权管理的分野,也作出过不小的贡献。他在声音、影像的分析领域的论文曾被大量引用,并且独创了以小波理论为基础的影像浮水印方法,对数字版权的保护起到了重要的作用。
而在学术成就的光芒之外,郭宗杰不只是一个学者,更是一个桃李满天下的教育者。
要知道,以一年一位的速度,一个教授穷尽教育生涯,能带出30位博士,已经算得上符合预期——甚至不少教授,甚至完不成这个数字。
而在南加大,郭宗杰耕耘36年,经他培养走出象牙塔的博士生,竟有160余人。超出了不少人博士生数量的七八倍,甚至十倍。
用“高产”一词,来形容这位新晋的ACM Fellow 绝不为过。而郭宗杰一路走来,能达到今天的成就,正是他近40年来专注学术、教书育人的写照。
200多年前,彼时仍是清朝的中叶,福建泉州,一位父亲带着三个孩子,乘船渡到海峡的另外一侧,历经不知多少艰难,在台湾的新竹定居安家。
光阴荏苒,白云苍狗,到郭宗杰出世,已经是他们来到台湾后的第六代子孙。
郭宗杰求学的青年时代,正是台积电在台湾锋芒毕露的时候。追着风潮,郭宗杰在台湾大学主修半导体,获得电机工程系的学士学位。
而当时的台湾半导体工业,台积电创始人张忠谋高喊:“我的公司不生产自己设计的晶片,只为半导体设计公司制造他们的晶片。”也是在这样的风潮下,半导体制造行业追求的,并非开创性的设计,而是在精益求精中提升晶片产出的效率和质量。
而郭宗杰的志向,却并不在此。
于是他在台大毕业后,转而远赴重洋,来到位于美国马萨诸塞州的剑桥市,在麻省理工学院继续进修。
当时的学术风口,是正在快速发展的并行计算技术,郭宗杰也一门心思铺在并行计算上,并在麻省理工一路拿到了博士学位。
而博士毕业后,郭宗杰再一次面临着关键的抉择:摆在他面前的有两个 Offer,一个是哥伦比亚大学电机系的助理教授职位,继续做并行计算相关的研究;而另一个,是UCLA的研究助理教授,并不是终身教职,而是一个三年的“合同工”,做数学方向的研究。
哥伦比亚大学招牌不小,做“老本行”研究,还是具终身职位缺,就在人们认为郭宗杰会接受这份邀约的时候,他却毅然决然地选择了UCLA,转而去研究数学。
早在研究并行计算的时候,郭宗杰就常常与数学“为伍”——解偏微分方程、优化、……他花费了不少时间阅读、学习。尽管从并行计算到应用数学,学术跨度很大,但郭宗杰心里始终有一股劲,或者称得上是一种“自傲”(Pride):
“工程总是可以做,但是要先到数学系去,跟一些做应用数学的人在一起——就是希望去最困难的环境中去受训,看看自己顶得住顶不住。”
一年半后,郭宗杰来到了南加大,回到电机系做研究。而在UCLA数学系的历练,让郭宗杰在同事中很受尊敬:有数学背景,做什么几乎都不成问题。
几十年后,郭宗杰回头再看这段经历,也不禁感叹,如果一直留在一个工程领域,待久了,很可能就出不来了;而也正是因为自己有着不错的数学基础,才能让自己在不少研究领域可以融会贯通。
也正是如此,才让郭宗杰在培养博士的事业上,能够春风化雨,培养出了大量业界的精英人才。
领域不设限
前面也提到过,郭宗杰教授在南加大36年时间,培养了一百六十多位博士。
完成这项成就,本就相当困难;而更难得的是,在郭宗杰培养出的这一百六十余位博士中,研究领域跨度巨大,从压缩、到通信、甚至再到生物信息不一而足。
领域五花八门,但郭宗杰的博士却有着相当相似的抉择——其中3/4选择了在博士毕业后,离开象牙塔,加入工业界,把学到的一身功夫,回馈给业界和市场。
能够如此,郭宗杰在教书育人的事情上,是有几个秘诀的。
首先,相比不少教授“死磕”的风格,郭宗杰的教育方式更务实:他不会因为学生实力强,就把他们在身边多留几年,帮自己做项目。
“我的出发点是‘成全’学生——我训练好学生,学生能完成好研究,我就放人。我做研究并不是为了‘成全’自己。”郭宗杰对AI科技评论如此说道。
郭宗杰知道,做老师很重要的一个精神,是以学生为中心,而非以自己为中心:“这会产生一个良性的循环——其实学生知道你在帮他,而且是帮他想,这样学生也会帮你想。这样,师生双方能够彼此能够尊重,能够彼此信任。”
于是,郭宗杰把他博士毕业期限,从一般的5年缩短到4年。由于他在跨领域研究中的长处,郭宗杰收人也不拘一格,组里常常有40多位博士,进行着不同方向的研究。
这种兼容并包,甚至称得上虚怀若谷,让郭宗杰的团队研究上有很大弹性和宽度,也让更多人能够在交叉领域研究中,获得更独特的学术和技术视点。
而南加大,作为美国的一家私立院校,也给予了教授很大的自主权,教授收了学生,只要能养,学生素质也够好,教授想收多少就收多少,不给生源设限——而事实上,郭宗杰也是能够“带兵打仗”的良将,能带学生、能发期刊,也能拿到资源和资金支持,对于老师和学校来说,是一场双赢。
郭宗杰的学生,毕业后都会成为工业界的精英,这也脱不开他的教育理念:“博士念到最后一年,我基本上要他们通通尽量出去,不要留在学校——最后很多人都去了Apple、Meta,几乎都是最好的公司。”
“我们不是一个非常理论的实验室——不少实验室做的理论性研究曲高和寡,理论性实验为主,而那些实验室出来的人,只能去做教授,很难融入工业界。”
而郭宗杰对于产学研结合,有很深的认同,他也更喜欢做可以实际产生影响力的项目,实验室不少题目,是来源于工业界的研究计划。
同时,郭宗杰很看重对学生日常的训练,尽量要做到扎实可靠,面向工业。实际4年时间,要博士生能够发出很多文章,的确有些强弩之末。
而在四年面向实战的训练后,郭宗杰的学生受到业界欢迎很多,单凭一块金字招牌,就足以让很多公司的高管对他们提起重视。不少大公司的高管,还会特意找到郭宗杰的学生,去探听郭宗杰实验室的研究方向,再去相应地投入人员追逐他们的脚步。
“我们是非常能够打仗的。”讲到这里,郭宗杰对AI科技评论兴奋地说。
产学研结合
要学生能打仗,郭宗杰本人也身先士卒,走在与工业界深度结合的第一线。
2020年,郭宗杰收到了一封邮件。
邮件里清清楚楚地写着:恭喜你,你的项目获得了艾美奖。
郭宗杰看过,开始只觉得是诈骗邮件,并没有在意——艾美奖是美国电视界的奖项,自己的确研究多媒体,不过从来没有报过名,通知自己得奖,基本可以断定是假消息。
而转念一想,邮件内容扎实、言之凿凿,又实在不像有假。当时只觉得奇怪,后来郭宗杰才猛然想起,这事可能和 Netflix 有关。
几年前,郭宗杰的实验室和 Netflix 曾经开展过一次合作,后者希望郭宗杰能够开发出一套视频质量评价技术,通过视觉评估,可以反映观者主观的感受。
Netflix 提供了原片和压缩过后的成片,而郭宗杰则提出了一个Fusion 的方法,把很多不同的、各具优缺点的 评估法 整合起来,再用机器学习的方法,把它们合在一起,再去做分析和评估。
这套方案实际效果一出,成果惊人。后来 Netflix 就给这套技术取名VMAF,并且做了开源。而VMAF技术,在后面的视频、广播、直播串流中,几乎成为了一种通用的解决方案,从亚马逊、到HBO、迪士尼,都在使用这一套技术。
作为VMAF的主创,郭宗杰都几乎已经忘记了这件事,而 Netflix 却一直在推广VMAF。于是,郭宗杰一封邮件发到Netflix,这才知道他们申请了艾美奖,还执意要把郭宗杰的名字写进去。
也直到这时,郭宗杰才彻底相信,自己拿到了艾美奖,是真实发生的现实。
“其实我也没有多想,”郭宗杰回忆道,“就只是拿到计划,计划做完,也就过去了。可是无心插柳柳成荫,直到你把事情做完,才知道过去种下的种子,长成了一棵大树——其实工业界很多事情,我的目的性不强,但合作多了,出来的成果也就蛮多的。”
除了直接在技术上推进创新,郭宗杰也乐于为企业招兵买马,组建团队。2000年左右,当时,郭宗杰还是一家名叫 InterVideo 的美国公司的首席科学家,辅助公司完成一些 WinDVD 相关的技术研究。而联发科的董事长蔡明介,恰好和 InterVideo 的老板熟识,机缘巧合下,郭宗杰就和联发科有了渊源。
而几年后,InterVideo 在纳斯达克上市,后将公司转卖给其他公司,引发了公司内部的巨大动荡,高层纷纷离开,郭宗杰也是其中一员。当时,联发科正在谋求组建公司 R&D 部门的机会,看到郭宗杰出来,就希望郭宗杰能够帮助他们建立一个研究团队。
郭宗杰不辞辛苦,作为公司的首席科学家,帮联发科招到了CTO,也完成了一些关键人员的招募,直接向联发科最高层的高管汇报,一手帮助联发科搭建起了 R&D 部门,也为联发科日后的增长和发展提供了重要的契机。
即使在象牙塔里,郭宗杰的团队,也称得上是相当独特。
在郭宗杰精力的巅峰,他的博士生团队里同时最多有40个人,按4年毕业来算,每年送走10人,再招新10人。
而光阴易逝,年华易老,36年在南加大的生涯如白驹过隙,“后来当然我年纪大了,身体各方面也不如从前,眼睛也不像以前那么好,当然也会慢慢减少学生,这没有办法。”
但即使如此,郭宗杰的博士团队在今天,仍能达到20人的规模,每年送走5人,再招新5人。这个人才输送的频率,不少年轻教授都做不到。
桃李满天下,郭宗杰的学生中不少,现在早已是全球各大科技公司在技术上的中流砥柱,在市场和业界发挥着重要的作用。
而如此高产的人才培育,也难免遭人质疑,也难免辛苦劳顿:“团队40人的时候,别人都认为我疯了——你干嘛要这么搞?”
而郭宗杰的想法却很简单,他对AI科技评论说,“我跟我太太讲:‘我不是为了我自己,只要我能多带一个,改变一个孩子的一生,只要我能做到,我一定会做。’”
本文作者董子博(VX:william_dong),重点关注AI大模型创业赛道和AI工程化的行业进展,欢迎交换认知,或闲聊八卦!
以下,是AI科技评论和郭宗杰教授的对话实录,其中谈到了更多郭教授在教书育人时的细节,以及“绿色计算”技术当下的进展与未来的展望。AI科技评论做了不变原意的编辑和整理:
AI科技评论:郭教授您好,在您门下的博士生有一百六十余位居多,您在招收博士生时,有什么标准吗?
郭宗杰:我想,招生还是非常重要,如果能选到好学生,就会事半功倍;如果选到一个比较差一点的学生,就会很头疼。
我的博士生源有两种来源。一种是在南加大里面比较优秀的硕士生,他们上过我的课,我在课上对他们了解,都是在课里面最顶尖的学生。我的课很大,一门大概有 100 多位学生,所以他如果在里面能排前几名,做事当中是最优秀的,所以可以当做一个招收。
另外就是从海外直接招收了。我早期有蛮多清华北大的学生,也都非常优秀。但是最近几年清华北大学生留美的比例在下降,我想主要的原因是很多留在国内,留在清华北大读。
我觉得对于国内也是一个好消息——顶尖人才可以留在国内做研究和学习。中国人有一大群非常勤奋的年轻人,我当然希望看到中国各方面都能有好的人才和成果出现。
AI科技评论:能招收这么多学生,您认为,为什么这些高水平的学生,愿意加入您的团队呢?
郭宗杰:面试过一个学生之后,我会和他说:你很好,我想收你,可是你不用急着答应我,你可以跟我的学生谈谈,他们觉得我们这里怎么样,你可能会听到最准确的资料。
另一方面,我也跟我的学生讲:你跟可能要入学到我们实验室的学生,你都讲实话。我也不会问他们讲了什么——你对真实情况撒谎,到时候学生进来,发现和之前了解的不一样,最后人家也留不下来。
对,所以我是觉得做老师的,我觉得要有一个老师的样子。我一开始的初心,也就是要帮助我的学生。后来带了那么多学生,我当初也没有想到,我只觉得我有能力带,带一个算一个。
帮助一个年轻人成长,让他进入到下一个阶段,陪他走一段路。有些学生,我知道他们能力可以,值得培养,这样的学生如果遇到了困难,我都宁可拖着他们走。
AI科技评论:那您认为,在您的实验室中,您的学生们大多都有怎样的气质和性格?
郭宗杰:我觉得我的学生们都非常认真、用功,自律性很强。
有些学生能够对问题进行独立探索,学生对于老师的依赖不会那么深,这样的学生,就不需要进行太多管束,让他们自由生长即可。
而有些学生相对比较弱,你需要很强的监督,要去注意,要去盯。有些人还是我觉得还是一个天生的,这种创造力还是不太一样的。
同时,我觉得整个实验室的士气非常重要,要赏罚分明。有些生源,可能根本就不适合读博士,读了一两年后差得还很远,我会跟他说:你真的没有办法读博士,还是走吧。我不愿意拖学生太久,一两个毕不了业,对其他人也会有影响。
但一般来说,有时在学生项目的末期遇到困难,只差一点点就可以完成,这些时候老师的心就要软一点,要妥协。遇到这种时候,我会想:如果这个孩子的父母亲在旁边,他们会怎么想?同时这样的事情,也可能在一个孩子一生中留下阴影。
这种情况,只要能符合我良心的标准,我都会有一些妥协。
AI科技评论:那您在教育事业达到今天的成就,桃李满天下,确实是有一些秘诀。
郭宗杰:我现在回想过去,觉得真的是很感恩——我也感谢我那些学生的信任,让我们能够有一个很好的关系。现在我见到一些毕业生的时候,我们的关系都非常好,主要还是在于一种彼此的信任。
AI科技评论:在多媒体和人工智能领域前沿奋战多年,您现在看到的,最大的科技发展趋势是什么?
郭宗杰:其实近期我们在和Meta合作,做一个关于压缩的项目在这个项目里,我们谈的就是“Green Image Coding”,希望用很低很低的算法,去得到很好的压缩的成果。
这个项目我们做了三年,但我觉得将来的影响会非常大——未来,我们降低碳排放是势在必行,而现在的趋势,却是疯狂地用各种运算,产生一个很小的改善。为了增加一点 AI 的表现和实力,要使用大量的运算。这不是一个能不能做到的问题,而是一个值不值得的问题。
所以现在,对我们来说,有两个指标,一个叫做 Effectiveness——功能性。它的正确率好不好;一个叫做 Efficiency,指它的效率、耗电量、碳排放效率怎么样。
当下的人工智能圈太注重小的正确率的改善,能耗却是无限地扩张。我就对他们说:这场狂欢要结束了。
AI科技评论:那对于这个趋势,业界的厂商怎么看?
郭宗杰:在过去,有很多公司跟我讲,他们一个月就要交百万美金级的电费,不得了的。而且现在,碳排放大的企业,也要考虑碳排放的税,超标还有罚金——能耗不会是一个可以不断增长的“数学题”。
关于绿色AI的事情,我是一直在推。直到去年下半年,我在很多不同的地方演讲,台下的反应开始变得极端热烈。
一个原因,是大家对深度学习也玩的够久了——玩了 10 年了。它他虽然有些优点,可他缺点可能更多,问题也很大——这些大家也都清楚。就是 Embedded system computing 基本上不可以用,它只能做到服务器端或云端。但把运算放到云端,它还是要花电的,并且用电量并没有少。
大家对深度学习的想象到了顶,而“绿色计算”却还有很多远景可以讲。举一个和Meta合作,做质量评估相关项目的例子:用深度学习的方式,去判断一张图片的质量,大概需要十亿级别的FLOPS;而用我们给出的方案做处理,则只需要百万量级的FLOPS,中间差了1000倍。
简单来讲,如果使用深度学习来做图象质量评估,要花1000块的电费;那么用我们的方案,电费只用花一块钱——而且结果正确率相差也不大。所以Meta看到我们的结果,就笑开怀了。
现在能耗效率会和绿色计算已经有很多人在关注,比如苹果和国内的一些公司都在追这项技术。过去大家对能耗绝口不谈,因为这是他们的弱点和软肋。
我认为,在未来十年,绿色计算会极大地改变行业现有的面貌。
最新CVPR 2023论文和代码下载
后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集
后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF
目标检测和Transformer交流群成立
扫描下方二维码,或者添加微信:CVer333,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲扫码或加微信号: CVer333,进交流群
CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉,已汇集数千人!
▲扫码进星球
▲点击上方卡片,关注CVer公众号
整理不易,请点赞和在看
微信扫码关注该文公众号作者