Redian新闻
>
新加坡国立大学尤洋:我的四个选择,本质的喜欢催动长久的坚持丨青源专栏

新加坡国立大学尤洋:我的四个选择,本质的喜欢催动长久的坚持丨青源专栏

公众号新闻


MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。
转载自 | 智源社区
整理 | 李梦佳

为了启发青年学者思考职业发展,激发科研灵感,智源社区推出青源专栏,定期邀请青源会员分享他们的研究思考和科研感悟。新加坡国立大学计算机系校长青年教授、青源会会员尤洋分享了他在高性能计算研究、创业经历以及在新加坡的生活所感。从求学读博跟随高性能计算专家James Demmel,到去往异国任教,再到后来几经辗转的创业之路,尤洋娓娓道来了人生中几次关键性的选择。他坚信,对于任何事或者人,只有本质的喜欢才能催动长久的坚持。

尤洋

他是新加坡国立大学计算机系的校长青年教授(PresidentialYoungProfessor),此前从加州大学伯克利分校计算机系获得了博士学位。尤洋的研究兴趣包括高性能计算、并行算法,以及机器学习。他当前的研究重点是大规模深度学习训练算法的分布式优化,曾创造ImageNet以及BERT训练速度的世界纪录,被几十家媒体广泛报道。他设计的算法被广泛应用于谷歌、微软、英特尔、英伟达等科技企业。尤洋近三年以第一作者身份在NIPS、ICLR、Supercomputing、IPDPS、ICS等国际重要会议或期刊上发表论文十余篇,并曾以第一作者身份获得了国际并行与分布式处理大会(IPDPS)的最佳论文(0.8%获奖率)和国际并行处理大会(ICPP)的最佳论文(0.3%获奖率)。尤洋在2021年入选福布斯30岁以下精英榜 (亚洲)并获得IEEE-CS超算杰出新人奖。同时,他也是潞晨科技 (HPC-AI Tech)的创始人。


1

『研究之选:在实践中设计算法,「我成了谷歌内部做实验最多的人」』

我博士阶段的研究方向是高性能计算(High Performance Computing),意思就是提升计算效率。在这方面做的最好的就是英伟达,英伟达GPU最开始是做游戏或图形处理,游戏图形处理和渲染需要很强的算力。英伟达CUDA做了很多这方面的优化,之后AI或者深度学习出来之后,对算力的要求很高,所以对高性能计算就有了很多的期待和需求。

于是我们与时俱进,因为高性能计算相当于我们的工具或锤子,AI是我们的钉子。很自然地,我现在就在做HPC+AI。最初选择这个方向,源于学习了英伟达的一些教程,发现了其中的乐趣。

我针对 ImageNet 图像数据集的训练提出了 LARS 优化器被 Facebook、腾讯、索尼、谷歌、富士通等公司使用,将 ImageNet 训练的时间从一小时缩短到了一分钟;针对 BERT 设计的 LAMB 方法则将三天三夜的训练时间缩短到了 76 分钟。这两项工作当时创造了ImageNet以及BERT训练速度的世界纪录,并被ScienceDaily、TheNextWeb、i-programmer等几十家媒体报道。

相比学校,英伟达、谷歌在内的硅谷最有影响力的大公司,计算资源十分丰富,英伟达GPU、谷歌TPU等内部可以无限使用。当时我与导师商量,想去工业界多实习,他也比较支持我。

根据伯克利的政策,在全职实习结束后,学生也可以每周投入一两天去工业界实习,于是我选择了加入谷歌。有趣的是,我作为实习生,几乎成了谷歌内部做实验做得最多的人,对实验细节非常清楚。当时估算了一下,一年如果按照TPU云计算市场的价格来算的话,大概花了谷歌上千万美元来做实验(当然在内部也不收我的钱)。经过实习,我摸清了很多tricks,也发现了很多规律,并结合这些规律设计了我自己的算法,实践是主要的驱动力。

基于这段经历给我的启发,目前我们的团队打造了名为「Colossal-AI」的高性能计算平台,它包括高效内存管理系统、自动的 N-维并行化系统和基于优化的动态调度系统。未来,我们的愿景是使用户可以在服务器、终端、甚至是手机上定义好模型,将其通过 Colossal AI 部署至云端,支持 CPU、GPU、TPU、FPGA 等多种硬件平台和 TensorFlow、PyTorch、Keras、Theano 等多种编程框架。这将帮助更多的高效、初创公司能够最大化效率、最小化成本,从而部署自己的模型和系统。

值得一提的是,实验环境与商业环境下的并行计算有一定区别。在实验室或者公司的研发部门训练模型,一般设为一个静态的过程,实验可以中间暂停。而在生产环境下,传统的并行计算(非AI)属于并发问题。比如,百度的搜索引擎如何处理大量的request,本质上也是一个并行计算的问题,它比较偏实时,注重scalability,即从10个用户扩展到100个用户或者1万个用户,能不能让用户的延迟不变,保持稳定性最为重要。

对于企业来说,硬件部署所需要的资金成本是十分关键的因素。如何打造高效率、低能耗的分布式人工智能系统至关重要。为此,Colossal AI 从「自动最大化并行计算」、「动态调度系统」、「内存优化」三个层面上提出了目前最先进的高性能计算解决方案。Colossal AI 是最完整实现并行化计算的高性能计算框架之一,支持层与层之间的流水线并行、张量并行、序列并行、数据并行优化。在张量并行方面,Colossal AI 实现了二维网格参数划分、三维立体参数划分、以及2.5维通信最小化参数划分。

在动态调度系统方面,我们实现了高效、高质量的动态资源管理。在芯片、batch 层面上实现了 GPU 使用率的最大化、通过广播训练状态和模型权重实现了高速工作迁移;根据中心训练状态检测器逐渐扩大 batch size 保证训练的稳定,并且使用了 LARS、LAMB 等先进的优化器。为了实现低成本的大规模 AI 模型调优,Colossal AI 还通过多级卸载实现了动态、智能、高效的内存优化与调度。

展望未来,高性能计算(HPC)领域重点在于它的可扩展性(auto-scaling)。对于用户而言,使用一个GPU的体验,应该和用一万个GPU的体验几乎没有区别,具有auto-scaling的能力。而在学术研究方面,我主要关注模型优化方法的开发,也关注 AIGC 或者自监督学习等新兴的研究课题。

2

『大师之选:HPC专家James Demmel 教给我的包容和自由』

在美国,研究者们从80年代就开始探索高性能计算,图灵奖得主Jack Dongarra实现了第一个世界上高效的矩阵乘矩阵的库,包括matlab也是基于他的工作。中国起步较晚,一直处于追赶状态,直到今天美国仍处于领先地位。高性能计算和国家战略挂钩,需要超级计算机,斯坦福、MIT等都无法过多投入在高性能计算方向。而伯克利是公立学校,有劳伦斯伯克利国家实验室,伯克利就有天然的优势去做高性能计算。

而我的博士导师James Demmel就是全世界研究HPC最知名的专家。他是美国科学与工程院院士,未来也有望获得图灵奖。他当过EECS学院的院长和计算机系主任。他给我印象最深的一点在于他的包容性特别强。

James Demmel教授

这种包容性从日常小事中就可见一斑。有一次他的一个博士后找他写推荐信,推荐到以色列的高校。他决定要帮那个学生,联系了很多学校,最后确实帮他拿到一两个offer。但是虽然他大费周章,最后学生决定不去了。一般正常人听到之后可能会比较生气,身为一个院士费了一番功夫帮你联系最后却不去了,反而还会把别人得罪。

我导师知道这件事后,只是笑笑说,「he changed his mind」。他对我影响最大的就是自由和包容。现在我自己作为教授和创业公司的创始人,也会平和接受年轻员工或学生的来去自由。他在教学上不吝付出,包括和本科生讲课也会花很多时间去备课。读博期间,我的几篇论文和他的职业生涯相比也许不足道,这不影响他在我身上投入大量时间。他在飞机上都还在帮我改论文,让我很感动。


3

『创业之选:成为AI领域的Databricks』

(注:2022年9月1日,潞晨科技宣布完成600万美元种子及天使轮融资)

关于为什么选择去创业,是因为我坚信,我们的技术和产品在未来AI落地过程中很重要,这是我的信仰。而信仰之外,投资人更看重的是效率,如何将技术迅速转化成产品。最前沿的技术过一二十年才能实现,技术落地意在将不现实因素去掉,力求短时间内普及或落地,帮助用户提升效率。对于我们公司而言,一个指针就是帮助AI企业加快AI产品开发速度,帮他们省钱,比如做一期AI产品需要投入300万人民币,我们试着100万人民币帮他做下来。

如果选取一个榜样或参照,我们其实想成为AI领域的Databricks。这家公司也由伯克利教授所创立,估值已达400多亿美金。Databricks的目标是提升大数据处理的效率,我们则是提升AI处理计算的效率,本质上类似,只是做的产品不同,他是我们一个很好的学习榜样。

这家公司成功的原因,第一,它的开源产品经得住市场的考验,世界500强中有多家公司都使用过它的大数据处理产品。第二,商业模式最终还是成功了,通过商业模式的合理设计,和亚马逊、谷歌等云厂商不产生竞争,这样使得它能够很好的存活下来,利润率也做得很高。

从0到1,再从1到10,创业公司想走向成功,我总结了几点困难:

  • 第一,做成这个(软件)之后,上市的企业到底喜不喜欢它,好不好用。

  • 第二,目标无法实现。比如设想加速10倍,做的过程中,我发现我不管怎么做还是到不了5倍。

  • 最后一点,软件做得很好,也达到预期目标,市场也很喜欢,但最终没人愿意付费。这就涉及到商业模式的问题,需要把整个链路跑通。

现阶段我们已经积累了一定的用户,也在向着这几个总体目标努力着。

很多人问我,当教授和创业者有什么区别?当教授,尤其是在美国做教授,需要自己去申请funding,申请完拿来去买机器、招学生、招博士后甚至招工程师。可能也面临着去能源部、甚至国防部去拿经费。而创业者是去向VC推销自己的技术或者产品,这点是很相似的。另外比较相似的是,大家都独立地去做事情。在学校做项目,在公司做产品,无论如何要把东西做好,都需要团队配合。值得一提的是,作为创业者,敢于冒险的探索精神是必要的,因为我们拿到的钱都是风险投资,本来就会有失败;更要快速适应变化,比如近期大火的AIGC,一瞬间所有投资人都在关注这个领域,因此创业必须要与时俱进。


4

『一些有意思的人』

我也想想讲讲一些遇见过的有趣的大佬。作为学生在谷歌实习期间,也有幸曾到黄教主家去拜访参观。作为华人,他的家布满东方文化,无论是从吃东西的餐具,到家庭布置等都非常diverse,他家中也有瓷器,还有很多印度人送的东西。他娶了个美国人当太太,他家的主流文化还是西方文化。他本人也比较传奇,看得出是个崇尚刺激的人。他有很多赛车服和跑车。

我印象最深的一点,黄教主本人十分平易近人,去他家的时候我还是个学生,他还专门给我开了啤酒,也没有拒绝和我合照。我见过一些亿万富翁,当学生的时候和他们拍照,他们一般会说不合适,或者拍照的时候板着脸,没有他这样随和。

另外就是我们的第一个投资人创新工场的李开复老师。就在最近,刚刚又和他在硅谷度过了充实的一周,还见到了雅虎创始人杨致远,OpenAI的两位创始人,斯坦福、伯克利的知名教授,以及很多科技朋友。还吃到了开复老师亲手做的卤肉饭和牛肉面。和投资人交流是很开心的经历。

5

『生活之选:在花园城市,和所爱的人一起生活』

目前,我大部分时间都在新加坡国立大学任教。新国立和伯克利、包括国内清华姚班的教学制度类似,学校很强调每位教职人员的独立性。系主任不等同于我的领导,只要没有学术道德问题,系主任也无权干涉我的工作,这种制度比较有利于科研创新。

工作选择上,我当时也拿了几个美国学校的offer,相较而言新加坡的工作待遇反而更高。之所以最终选择去新加坡,也是因为我是一个注重生活质量的人。在美国,吃一顿中餐要开车好几个小时,而新加坡小而干净,还是华人社会,无论是饮食,还是基础设施各方面,当然和美国相比更适合华人。游玩方面,新加坡市内也有很多自然公园,有很多划船等娱乐设施,也有环球影城,当然更重要的是那一带签证比较方便。从新加坡去普吉岛、马来西亚或者马尔代夫很方便,整体上我对新加坡的工作生活目前来看还是比较满意。

个人方面,我读博期间就结婚了,我虽然今年才31岁,但是我已经有两个孩子。很多人觉得结婚很浪费时间。李开复老师就是一个鲜活的例子,他也读了博士,21岁就结婚了。其实结婚早反而会让人更加专注。我认识的一个同学,因为和女朋友分手,大半年人就很颓废,反而影响到了他很多,毕竟这是我们人生发展必须要做的事情。当然人生的成功可能是由自己定义的,并不是由一些KPI决定的。

当我们为某件事,某个人付出了很多时间和精力,最初的动力是源于我们的在乎,源于最本质的喜欢。我甚至想,不应该过多追求这种人际关系或者恋爱关系中的舒服感,舒服感可能只是持续一段很短的时间,本质的喜欢可能更持久,因为不管和谁结婚,最终都会有遗憾。

就像张朝阳说的,他都是亿万富翁了,还是感觉很焦虑很不满足,因为人类本身就是非常贪婪的。我们人生可能就只有三四万天,有效的生命只有两万天,为什么我们不做一些喜欢的事情(比如说创业)。我觉得不妨大胆地去努力和一个最喜欢的人在一起,这样即便有遗憾,也是值得的。


技术交流群邀请函

△长按添加小助手

扫描二维码添加小助手微信

请备注:姓名-学校/公司-研究方向
(如:小张-哈工大-对话系统)
即可申请加入自然语言处理/Pytorch等技术交流群

关于我们

MLNLP 社区是由国内外机器学习与自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外知名的机器学习与自然语言处理社区,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。
社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
潞晨科技尤洋:中小企业同样追求大模型,但最先进AI训练成本还是太高 | MEET 2023人与人之间,最长久的关系!(精辟)11/9 波士顿新闻汇总|莫拉·希利当选麻州首位女州长 麻州四个选票问题的结果出炉 选举看点:共和党人没有获得压倒性胜利ANU澳大利亚国立大学中国中心招聘无论是夫妻还是情人,最长久的关系,只有2个字2022 TBI演讲嘉宾重磅揭晓|林清轩、伽蓝、妙可蓝多、飞利浦、梅见、保利沃利、新加坡国立大学无论是夫妻还是情人,最长久的关系,只有两个字积木式深度学习的正确玩法!新加坡国立大学发布全新迁移学习范式DeRy,把知识迁移玩成活字印刷|NeurIPS 2022男男恋有罪化成为历史!新加坡国会确认废除377A法案彭国邦:太古的坚持与拒绝活着就意味着长久的生病【新加坡留学】入境政策简化,新国立23fall可申专业、申请时间汇总!历史首次!新加坡国立大学突破全球大学声誉排名前20从2022走向2023,消费品牌的坚持、蜕变和破局重生Project IKEA part 2 lol【今日项目】steam搬砖项目拆解,稳定而长久的副业博士申请 | 新加坡国立大学Robby T. Tan教授招收计算机视觉方向博士生人与人之间,能够长久的关系,是这样的陌上深圳012 期待相遇,珍惜当下的选择,就是最好的选择中部哈佛?美国公立大学的翘楚,历史最悠久的大学之一!就读体验来了【庆国庆快闪】《共和国之恋》中年老母的坚持:不剪头发!新加坡国大商学院教授万字长文,预测2023年世界各国经济走势“婚姻长久的夫妻,睡前一定会做这件事”美国公立大学/私立大学/文理学院的优劣势分析,究竟有哪些细节区别?2023全美最佳公立大学榜单出炉!超牛的顶尖公立大学,真的不只有UC!老人要健康,宜多站少坐2023 SIPC 新加坡国际钢琴比赛【新西兰赛区】暨网络人气评选活动正在报名中新的一年,坚持吃饭、坚持创作、坚持快乐!坚持熬大夜——必须改掉,不能熬夜!博士生申请 | 新加坡国立大学Robby T. Tan老师招收博士/博士后/研究助理/访问学生士后/研究助理/访问学生捷报 | 新加坡国立大学研究生OFFER到!专排全球前六!婚姻不一定就是爱情的必然结果陈吉宁:平庸与卓越的差别,不在于天赋,而在于长期的坚持!一位陌生女子留下的字条人生最怕的不是做错选择,而是“不做选择”。
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。