AI世界华人的群星闪耀时

2023-09-12 03:09

来源丨石麻笔记

作者丨渣大米

图源丨图虫创意

这篇文章，我们会着重梳理机器人领域里的AI派，尤其是用强化学习（Reinforcement Learning）、深度强化学习（Deep Reinforcement Learning），模仿学习（Imitation Learning）、迁移学习（Transfer Learning）、元学习（Meta Learning）等算法来解决机器人学习（Robot Learning）和控制问题的团队。

机器人派和AI派的划分主要还是源于人形机器人软件控制的迭代。人形机器人的控制算法主要分三代：第一代，用简单的基于模型的控制算法（LIPM+ZMP），代表机器人ASIMO；第二代，动态模型控制和最优控制算法（MPC+WBC），代表机器人Atalas；第三代，模拟+强化学习。这些算法各有优劣，我们这里不做过多技术上的探讨。但就从事研究的人来源来说，第一代和第二代基于模型控制的算法一般是控制、自动化或电子系的人在搞；第三代Sim+RL的算法，一般是计算机系AI方向的人在搞。我们今天探讨的AI+Robotics华人图谱偏向于第三代这种基于AI来交叉Robotics的华人学者。

1. UC Berkeley BAIR

Highlight紫色：海外教职；绿色：在读；黄色：国内教职；蓝色：企业

UC Berkeley Robot Learning华人图谱

整个Robot Learning领域，或者说AI+Robotics，UCBerkeley可谓一手遮天。在知乎上看到一个说法：“其他学校的实力甚至相当程度取决于距离伯克利的地理距离…”，从CoRL接收论文作者的统计来看，还真是这样，排名第一UC Berekely，第二Stanford，第三UW。

CoRL会议论文作者统计

UC Berkeley AI+Robotics这个领域最强是Pieter Abbeel派系，他是将深度强化学习应用在机器人方面的先驱人物，于2021年获得ACM 计算奖的荣誉。在获奖公告中，ACM 提到：「Pieter率先教会机器人从人类演示中学习（模仿学习）和通过自己的反复试错学习（强化学习），这为下一代机器人技术奠定了基础。」我们在（Covariant：三个华人小伙创办的AI4Robot独角兽）中详细的介绍过Pieter Abbeel和他的三个华人学生张天浩，段岩，陈曦共同创立的AI+Robotics独角兽公司Covariant。Abbeel和他的团队也是Open AI之前具身智能项目的主要参与者，后来Open AI将具身智能项目暂停。

Pieter Abbeel现为加州大学伯克利分校计算机科学与电气工程教授，伯克利人工智能研究实验室（BAIR）的联合主任，伯克利机器人学习实验室（Berkeley Robot Learning Lab）主任，他最出名的是在机器人和机器学习方面的前沿研究，特别是在深度强化学习（deep reinforcement learning）方面。他于2000年获得比利时鲁汶大学电气工程学士和硕士学位，并在斯坦福大学获得计算机科学博士学位。Pieter Abbeel是AI大牛吴恩达的第一个博士生，这里值得一提的是吴恩达博士论文就是RL领域，但他后期的工作没有在RL这个领域继续，Pieter Abbeel作为吴恩达的第一个学生，延续了吴恩达在RL的传承，并成为当今RL+Robotics最强的一个派系。

Abbeel在AI+Robotics领域可谓桃李满天下，他一个学生近些年霸榜Robot Learing各大顶会——Sergey Levine。Levine在Robot Learning领域的顶会CoRL参与的Paper多达41篇，遥遥领先其他学者。Levine又培养了这个领域的另一个牛人Chelsea Finn，目前在Stanford做教授。Pieter Abbeel，Sergey Levine，Chelsea Finn这师徒孙三代人以及他们的徒子徒孙，按照发Paper的量来说可能占据了如今AI+Robotics领域的半壁江山。Pieter的徒子徒孙也遍布北美各大厂，包括谷歌，英伟达，OpenAI等。值得一提的是，提出RLHF的OpenAI强化学习团队负责人John Schulman也是Abbeel的学生。此外，Abbeel在AI+Robotics领域的种子也散步在中国，我们后文提到的清华叉院的吴翼和高阳在博士期间在Pieter的指导下做出很多优秀成果。

Sergey Levine目前是UC Berkeley电气工程与计算机科学系的副教授，同时是RAIL(Robotic AI&Learning Lab@BAIR)实验室主任。除了在Berkeley的教职，Levine也是Google Brain的研究员，他也参与了Google知名的机器人大模型PALM-E，RT1和RT2。Sergey Levine于2009年获得斯坦福大学计算机科学的学士和硕士学位，并于2014年获得斯坦福大学计算机科学的博士学位，导师是Vladlen Koltun，他博士后期间在加州大学伯克利分校与Pieter Abbeel教授合作。他的研究重点是用于决策和控制的机器学习，重点关注深度学习和强化学习算法，应用方向主要在机器人和自动驾驶方面。他在发Paper方面非常的高产，Robot Learning的顶会或期刊（CoRL，ICML，RSS，ICRA，RSS这些），别人都是几年发一篇，他是一年发几篇，甚至十几篇。在知乎上看到关于Sergey Levine的一些评价，褒贬不一，但关于勤奋的评价是一致的，比如为了节省时间一天只吃两顿饭，比如全年无休只有老婆生孩子休息了一天之类。

Trevor Darrell是UC Berkeley电子工程与计算机科学系的教授，BAIR实验室的创始人和联合领导者。Darrell教授于1999年至2008年期间在麻省理工学院（MIT）电子工程与计算机科学系任教，并负责指导视觉接口研究组。他分别于1992年和1996年获得了MIT的硕士和博士学位。他在1988年获得了宾夕法尼亚大学的学士学位。

Darrell教授的研究小组致力于开发大规模感知学习的算法，包括对象和活动识别与检测等领域，用于各种应用，包括自动驾驶车辆、媒体搜索以及与机器人和移动设备的多模态互动。他的研究兴趣领域包括计算机视觉、机器学习、自然语言处理以及基于感知的人机界面。在AI+Robotics领域，Darrell教授也培养了很多优秀的学者，包括UCSD 王小龙，清华叉院高阳和许华哲。

Chelsea Finn是Stanford计算机科学与电气工程系的助理教授。她的实验室IRIS通过大规模的机器人互动研究智能，并与SAIL（斯坦福人工智能实验室）和ML Group（机器学习团队）有合作关系。他还在谷歌的Google Brain团队工作。她对机器人和其他智能体通过学习和互动来发展广泛智能行为的能力感兴趣。他在UC Berkely完成了计算机科学博士学位，师从Sergey Levine，本科毕业于MIT。

因为Sergey Levine和Chelsea Finn都在Google担任研究员，他们本身以及学生也参与到了Google机器人大模型的工作。其中华人代表有：

Tianhe (Kevin) Yu是Google Brain的研究科学家。他在Chelsea Finn指导下，获得了Stanford计算机科学的博士学位，本科毕业于UC Berkeley，主修计算机科学、应用数学和统计学，并取得了最高荣誉。他的研究兴趣集中在机器学习、感知和控制的交叉领域，特别关注离线强化学习（即从静态数据集中学习）、多任务学习和元学习。他参与了谷歌机器人基础模型PaLM-E和RT1。

Jianlan Luo是伯克利人工智能研究（BAIR）实验室的博士后学者，与Sergey Levine教授一起工作。在2022年全职回到学术界之前，他在Google [X]担任研究员，与Stefan Schaal教授合作了两年。他于2020年在加州大学伯克利分校获得博士学位。他还曾在Deepmind和Everyday Robots工作过。

UC Berkeley除了Pieter Abbeel和Trevor Darrell两位教授，Anca Dragan和Koushil Screenath两位教授在AI+Robotics领域也有很多成果，也培养了一些华人学者，不一一列举。

2. Stanford SAIL

Stanford Robot Learning华人图谱

李飞飞是华人在AI领域最具影响力的学者之一，她是斯坦福大学人工智能实验室（SAIL）教授，美国国家工程院院士，知名CV数据集ImageNet的牵头人，斯坦福视觉与学习实验室（SVL）的联合主任。她曾担任Google的副总裁，并担任Google Cloud的AI/ML首席科学家。李飞飞博士于1999年获得普林斯顿大学物理学学士学位，于2005年获得加州理工学院电气工程博士学位。李飞飞Google Scholar被引量217784。

李飞飞团队近些年在具身智能领域有很多成果，包括用于评估具身智能模型表现的基准BEHAVIOR。BEHAVIOR 1K Benchmark拥有来自大规模人类偏好调查的1,000种活动，8种场景类型，50个完全可交互的场景，1,200多种物体类型，5,000多种物体模型。

此外，李飞飞团队还开发了两个机器人学习框架 ROBOTURK和SURREAL，将高质量的数据集整合到先进的强化学习中。RoboTurk被称为机器人领域的ImageNet，它是一个以众包的形式制造机器人控制数据集的平台。为了解决深度学习算法和机器人研究中的可复现性问题，SURREAL是一个开源的可扩展框架，支持最先进的分布式强化学习算法，适用于在线策略学习和离线策略学习。简单理解，ROBOTURK解决机器人学习中的数据问题，SURREAL解决通过数据进行强化学习训练和结果评估的问题。SURREAL框架的一作分别是李飞飞的两位高徒范麟熙（Jim Fan）和朱玉可。

李飞飞团队今年6月发布具身智能新成果VoxPoser，使用LLM+VLM，从3D空间分析出目标和环境障碍，帮助机器人实现行动规划，让真实的机器人在未经训练的情况下直接执行任务。

https://voxposer.github.io/

这里稍微提一下SVL（Stanford Vision and Learning Lab），这个lab是李飞飞和他老公Silvio Savarese创立，目前实验室有两位全职教授（李飞飞和她的学生吴佳俊）以及两位兼职教授（李飞飞老公Savarese和Carlos Niebles，这两位目前都在Salesforce做AI 科学家）。

SVL Faculty

SVL下有一个专门研究具身智能的团队叫People, AI & Robots Group（PAIR），专注于开发通用机器人感知和控制的方法和机制。致力于解决计算机视觉、机器学习和机器人领域交叉的复杂问题，开发的算法和系统融合了强化学习、控制理论建模以及二维/三维视觉场景理解，以教导机器人感知和与物理世界进行交互。李飞飞的SVL培养出了非常多Robot Learning领域的华人学者，我们接下来一一介绍。

吴佳俊是Stanford计算机科学系的助理教授，是SAIL和李飞飞SVL的教职成员。他的研究领域涉及机器感知、推理以及与物理世界的互动，灵感来自于人类认知。他在MIT获得了博士学位，导师是Bill Freeman和Josh Tenenbaum，本科毕业于清华姚班。知乎上有很多关于吴佳俊在姚班时代的传奇故事，学神级人物。今年上海WAIC大会上听了吴佳俊的一个演讲，当时的感觉就是聪明人的语速也太快了。吴佳俊Google Scholar被引量16510。

范麟熙（Jim Fan）目前是NVIDIA AI的研究科学家，他的研究方向是开发通用的自主智能体（capable autonomous agents），研究领域包括基础模型，机器人学，多模态等。他在Stanford SVL获得博士学位，师从李飞飞。他作为一作的MineDojo获得2022年NeurIPS优秀论文奖，MineDojo是一个基于Minecraft的开放式通用人工智能学习平台。他也是SURREAL框架的一作。被引量4280。

朱玉可目前是UT Austin计算机科学系的助理教授，是Robot Perception and Learning (RPL) Lab的主任，以及NVIDIAResearch的高级研究科学家。他带领的RPL Lab聚焦于两个研究方向：机器人学和具身智能。朱玉可本科毕业于浙江大学，硕博就读于Stanford，是SVL和PAIR成员，师从李飞飞。他因在 SURREAL 机器人框架研究中的贡献而被人所熟知。他带领学生还有一个有趣的工作是煮泡面机器人。被引量14243。

https://sites.utexas.edu/hcrl/

Danfei Xu是佐治亚理工学院互动计算学院的助理教授，同时也是NVIDIA AI的（兼职）研究科学家。研究方向是机器人学和机器学习的交叉领域。他在Stanford获得了计算机科学博士学位，导师是李飞飞和Silvio Savarese（2015-2021），并在哥伦比亚大学获得了学士学位。他是佐治亚理工学院的Robot Learning and Reasoning Lab（RL2）的主任。被引量5935。

向宇是UT Dallas计算机科学系的助理教授，他曾在NVIDIA Research担任高级研究科学家。他在密歇根大学跟随Silvio Savarese获得博士学位，他在UW跟随Dieter Fox教授做博士后研究员，还曾在Stanford SAIL担任访问学生研究员，本科毕业于复旦大学。被引量9617。

李飞飞曾在Google担任首席人工智能科学家，她的团队和Google合作紧密，也有多位学生在Google机器人领域担任重要工作。比如以下几位：

夏斐（Fei Xia）是Google DeepMind的高级研究科学家，在机器人团队工作。他在Silvio Savarese和Leo Guibas共同指导下获得了Stanford的博士学位，本科毕业于清华大学自动化系。他的研究兴趣集中在计算机视觉和机器人领域，包括RL、Imitation Learning以及Sim2Real的迁移学习。他近期的工作聚焦在探索使用基础模型来进行机器人决策制定，参与了知名的谷歌机器人大模型PaLM-E，RT1和RT2。被引量4514。

黄文龙（Wenlong Huang）是Stanford SVL的博士研究生，是李飞飞的学生。他于UC Berkeley获得学士学位（2018年至2021年），并在谷歌Brain的机器人团队进行了实习（2022年）。他是VoxPoser的一作，也参与了PaLM-E。被引量860。

Kuan Fang是伯克利人工智能研究（BAIR）的博士后学者，与Sergey Levine合作。他在斯坦福大学获得博士学位，导师是李飞飞和Silvio Savarese，本科就读于清华大学。他曾在Google Brain、Google [x] Robotics和微软亚洲研究院工作过。他的研究旨在使机器人能够在不受限制的环境中解决各种复杂任务，致力于构建可扩展的数据驱动方法，用于机器人感知和控制。被引量1249。

李飞飞还有几位高徒，在北美其他高校就职，已经逐渐形成了自己的影响力。比如UCSD的苏昊，UIUC的Yunzhu Li。我们将在后文做详细介绍。李飞飞团队在国内的枝叶散步在清华和上海交大，清华叉院许华哲博后阶段和李飞飞团队的吴佳俊合作，上海交大卢策吾博后阶段和李飞飞合作，后文会有详细介绍。

3. MIT CSAIL

MIT CSAIL在AI领域有多强不必多说，但在Robot Learning这个领域，和Berkeley以及Stanford相比，并没有特别强势的研究群体。MIT培养的Robot Learning领域华人学者略微分散，我稍微整理了下，可能非常不全，也欢迎读者们来补充。

Chen Tao目前是MIT CSAIL的博士生，由Pulkit Agrawal教授指导。研究兴趣围绕机器人学习（灵巧操控、行走、导航）。他于2019年5月获得卡内基梅隆大学机器人研究所（CMU RI）的硕士学位，由Abhinav Gupta教授指导。他曾在上海LX Robotics担任研究工程师。本科毕业于上海交通大学。他在机器人手部灵巧操作上有很多不错的工作。Chen Tao的博士导师Pulkit Agrawal（印度人）算是在MIT AI+Robotics领域比较强的一个教授，他于2019年博士毕业于UC Berkeley，团队有几个华人，但都还没毕业。

Jie Xu目前是NVIDIA机器人实验室的研究科学家，由Dieter Fox教授领导。他在MIT CSAIL取得博士学位，师从Wojciech Matusik教授。本科毕业于清华大学计算机科学与技术系。研究主要方向机器人、仿真、机器学习的交叉领域。感兴趣的主题: 机器人控制、强化学习、基于可微分物理的仿真、机器人控制和设计协同优化、模拟现实。他和Chen Tao共同参与的手部灵巧操作论文获得了2021 CoRL Best Paper。

https://taochenshh.github.io/projects/in-hand-reorientation

MIT 毕业的赵行和郝建业我们会在国内部分介绍，Yunzhu Li和吴佳俊已经在李飞飞团队做过介绍。

4. CMU RI

CMU在传统机器人领域非常强，在AI+Robotics领域近些年比较活跃的教授有Abhinav Gupta，David Held和Deepak Pathak。其中Deepak Pathak（印度人）也算是UC Berkeley分出去的树杈子，他博士毕业于UC Berkeley导师是Alyosha Efros和Trevor Darrell，博士后跟着Pieter Abbeel。他曾在Meta AI Research担任研究员。Deepak Pathak招了不少华人学生，从本科到博士，但他还比较年轻，第一批博士还没毕业。Abhinav Gupta（印度人）的研究领域比较杂，Vision，language，robotics都有，他是UCSD教授王小龙的博士生导师，MIT在读博士Chen Tao的硕士导师。David Held是CMU RI的副教授，也是RPAD实验室（Robots Perceiving And Doing）的主任。他的研究侧重于感知型机器人学习，他博士毕业于Stanford，导师是Silvio Savarese和Sebastian Thrun，博士后在UC Berkely读的，按传承来看他也算是Stanford和Berkeley的分支。David Held的一位博士生Xingyu Lin，目前在伯克利人工智能研究（BAIR）实验室的博士后研究员，与Pieter Abbeel合作，本科毕业于北京大学。

石冠亚是刚入职CMU RI的助理教授，创立了LeCAR（Learning and Control for Agile Robotics）实验室。他于2022年获得了Caltech的博士学位，导师是Soon-Jo Chung和Yisong Yue。他于2017年从清华大学获得了学士学位。从2022年到2023年，他在UW担任博士后研究员，与Byron Boots合作。被引量867。

5. UW & Nvidia

Dieter Fox是华盛顿大学计算机科学与工程学院（Paul G. Allen School of Computer Science and Engineering，简称CSE）的教授。他在德国波恩（Bonn）长大，并于1998年从波恩大学（University of Bonn）计算机科学系获得博士学位。他于2000年秋季加入华盛顿大学，是华盛顿大学机器人与状态估计实验室（UW Robotics and State Estimation Lab，RSE-Lab）的负责人，同时是Nvidia Robotics Research Lab（英伟达机器人研究院）负责人。被引量88135。和Dieter Fox合作的华人学者包括向宇（Dieter Fox的博后，Stanford部分提到），Xu Jie（MIT部分提到）。

Byron Boots现任UE CSE的教授，也是华盛顿大学机器人学习实验室（UW Robot Learning Laboratory）的负责人。Byron在卡内基梅隆大学机器学习系获得了博士学位，在UW Dieter Fox的指导下完成博士后研究。他指导的华人学生也不少，有一位博后Siyuan Dong（董思远）目前在华为工作，另一位博士后石冠亚目前是CMU RI的助理教授。

6. UCSD

王小龙是UCSD电子与计算机工程系的助理教授。他曾在加州大学伯克利分校与Alexei Efros和Trevor Darrell一起担任博士后研究员，在CMU RI获得了机器人学博士学位，师从Abhinav Gupta。他的研究重点是通过视频和物理机器人交互数据来学习3D和动态表示。促进机器人技能的学习，目标是使机器人能够在真实物理世界中与各种对象和环境有效互动。被引量20474。

苏昊是UCSD的计算机科学助理教授。他是UCSD Embodied AI Lab主任，他在Stanford获得了计算机科学博士学位，师从李飞飞，参与了ImageNet。他领导开发的ShapeNet和PointNet等工作奠定了三维深度学习方向的基础。近些年，他专注于开发具身智能人工智能系统，主持了SAPIEN和ManiSkill具身智能基础平台和面向具身智能的三位大模型研究。被引量83907。

7. 北美其他高校及企业

UIUC

Yunzhu Li是UIUC的助理教授，他曾在斯坦福大学视觉与学习实验室（SVL）担任博士后研究员，与李飞飞和吴佳俊合作。他在麻省理工学院计算机科学与人工智能实验室（CSAIL）获得博士学位，导师是Antonio Torralba和Russ Tedrake，本科学士学位则来自北京大学。他在UIUC创立了机器人感知、交互和学习实验室RoboPIL，致力于机器人技术、计算机视觉和机器学习的交叉领域研究。被引量2914。

Stanford

宋舒然是斯坦福大学的助理教授。在此之前，他曾是哥伦比亚大学的助理教授，是Columbia Artificial Intelligence and Robotics Lab的负责人。他的研究聚焦于计算机视觉和机器人技术。本科毕业于香港科技大学。被引量23268。

Google Brain

Jie Tan目前是Google Brain Robotics的机器人运动和安全团队的技术lead，他的研究重点是使机器人能够自动学习在现实世界中完成复杂任务的技能。他在佐治亚理工学院的计算机图形实验室获得了博士学位，由Greg Turk和Karen Liu指导。本硕毕业于上海交通大学。被引量7514。

Google DeepMind

Andy Zeng是Google DeepMind的研究科学家，他的研究专注于机器人学习，旨在使机器能够智能地与世界互动并不断提高自己。他在UC Berkeley获得计算机科学和数学学士学位，之后在Princeton获得计算机科学博士学位。他参与了谷歌机器人大模型PaLM-E的工作。被引量7819。

8. 清华大学

吴翼，清华叉院助理教授，本科毕业于清华姚班，博士毕业于UC Berkeley，师从AI泰斗 Stuart Russell，博士期间也跟随Pieter Abbeel做强化学习领域的研究。回国前曾在OpenAI担任研究员，期间完成了著名的小蓝人和小红人躲猫猫强化学习试验。他的研究领域包括深度强化学习、多智能体学习、自然语言理解、大规模学习系统。他在RL+Alignment（人类目标对齐）方面有很多工作，在基于LLM的Base Model上，通过RL和Alignment实现AGI。被引量7310。他参与创办了边塞科技并担任首席科学家。

OpenAI

高阳，清华叉院助理教授，本科毕业于清华大学计算机系，博士毕业于UC Berkeley。博士导师是Vision领域的大牛Trevor Darrell，读博期间和Sergey Levine合作开始强化学习方面的探索，博后跟随Pieter Abbeel做强化学习，合作的导师都是RL+Robotics这个领域的大牛。研究方向为计算机视觉和机器人的结合领域，教会机器人通过“看”去操纵周围的事物。RL用在机器人领域有一个问题是现实数据匮乏的问题，高阳的两个工作Efficient Zero和SpeedyZero就是为了解决现实世界样本效率的问题，效率是DQN算法的500倍。被引量3165。

许华哲，清华叉院助理教授，本科毕业于清华大学，博士毕业于UC Berkeley，导师是Trevor Darrell。曾在Stanford SVL做博士后研究员，导师是吴佳俊。他的主要研究领域是强化学习，机器人学，机器人触觉。他近期的工作包括让机器人操作柔性物体的机器人系统RoboCraft（可以用它来包饺子），提高模型组合性泛化的能力，以及运用材料的物理性质设计出触觉传感器。被引量2667。

https://hshi74.github.io/robocook/

陈建宇，清华叉院助理教授，本科毕业于清华大学，博士毕业于UC Berkeley，导师是Masayoshi Tomizuka。他是清华大学智能系统与机器人实验室（ISR Lab）的负责人，致力于人工智能和机器人学领域的交叉研究，以构建高性能和高智能的先进机器人系统。陈建宇也是人形机器人公司星动纪元的创始人。被引量1288。

赵行，清华叉院助理教授，本科毕业于浙江大学，博士毕业于MIT，导师是Antonio Torralba，曾在Waymo担任研究科学家。赵行在基于视觉的控制领域有很多研究成果，尤其在自动驾驶方面。他在清华创建了MARS Lab多模态学习实验室，尝试解决一系列探索性的AI问题，当前特别感兴趣如何让机器像人一样的能够通过多种感知输入进行学习、推理和交互，研究领域涵盖多媒体计算、自动驾驶、机器人、多传感器。被引量13455。

9. 北京大学

王鹤，北京大学前沿计算研究中心助理教授，本科毕业于清华大学，博士毕业于斯坦福大学，师从美国三院院士Leonidas. J Guibas教授。他创立并领导了具身感知与交互实验室(EPIC Lab)，实验室立足三维视觉感知与机器人学，重点关注具身机器人在三维复杂环境中的感知和交互问题，研究目标是以可扩增地方式发展高泛化性的机器人视觉和控制系统。研究成果覆盖物体抓取、功能性操控、灵巧操作及寻物导航。王鹤创立了人形机器人公司银河通用。被引量1762。

卢宗青，北京大学计算机学院助理教授，博雅青年学者，本科毕业于东南大学，博士毕业于新加坡南洋理工。主要研究方向为强化学习和通用智能体。被引量2410。

董豪，北京大学前沿计算研究中心助理教授，博士生导师，于2019年8月正式加入中心。研究重点包括可泛化的机械臂操作、机器人视觉和移动设备自主决策等方面。董博士于2019年秋从英国帝国理工毕业，师从郭毅可教授。他曾于2012-2014年间与郭毅可教授共同创办脑机接口开发的初创公司。他还领导了北京智源人工智能研究院（BAAI 北京智源）的具身人工智能中心，他还是鹏城实验室（PCL 鹏城实验室）的成员。被引量4534。

10. 上海交通大学

卢策吾是上海交通大学的教授，他曾在斯坦福大学进行博士后研究，师从Fei-Fei Li教授和Leonidas J. Guibas教授，他在香港中文大学获得博士学位，导师是贾佳亚教授。他的研究兴趣主要集中在计算机视觉、深度学习、深度强化学习和机器人视觉领域。他也是通用智能机器人公司非夕科技的首席科学家。被引量15226。

张伟楠是上海交通大学的副教授，于2016年从伦敦大学学院（University College London）获得博士学位，2011年从上海交通大学ACM班获得工程学学士学位。他的研究兴趣包括（多智能体）强化学习、机器人技术、深度学习以及数据科学。被引量17581。

11. 国内其他高校及企业

南京大学

俞扬是南京大学人工智能学院教授，南京大学LAMDA教授。南大LAMDA实验室在国内强化学习领域数一数二。俞扬分别于2004年和2011年获得南京大学计算机科学与技术系学士学位和博士学位。他的研究方向主要专注于强化学习。强化学习通过自主地从环境互动中学习，寻找接近最优决策的策略。他是初创公司南栖仙策 (Polixir)的创始人兼CEO。被引量4856。

天津大学

郝建业是天津大学副教授、华为诺亚方舟决策推理实验室主任。他于2013年获得香港中文大学计算机科学与工程学博士学位，于2008年在哈尔滨工业大学获得学士学位，并在MIT CSAIL从事博士后研究。2015年回国后，在天大成立了深度强化学习实验室。主要研究方向为深度强化学习、多智能体系统。

腾讯RoboticsX

腾讯Robotics X实验室成立于2018年，主要研发人机协作的下一代机器人。目前主攻移动、灵巧操作、智能体等三大通用机器人技术的研究与应用，聚焦多模态移动机器人的研发。2023年4月，腾讯 Robotics X 实验室发布了灵巧操作研究成果，并推出自研机器人灵巧手“TRX-Hand”和机械臂“TRX-Arm”。

腾讯

TRX Hand灵巧操作论文的通讯作者黄碧丹目前任腾讯Robotics X高级研究员。她的主要研究兴趣包括机器人学习、控制、抓取和操作。她于2015年从英国巴斯大学获得机器人学博士学位。她目前是英国伦敦帝国学院汉林机器人外科中心的研究助理。在2012年至2014年期间，她曾是瑞士洛桑联邦理工学院学习算法与系统实验室的访问学生。她的研究目标是为机器人在医疗、工业和日常生活环境中实现人类水平的手部灵巧，以进行物体操控。

2023年6月，腾讯 Robotics X 机器人实验室公布了智能体研究的最新进展，通过将前沿的预训练 AI 模型和强化学习技术应用到机器人控制领域，让腾讯机器狗 Max 的灵活性和自主决策能力得到大幅提升。

腾讯

使用预训练模型和强化学习对机器人进行控制的论文一作韩磊是腾讯Robotics X实验室的首席研究员，负责Agent Learning Center的指导工作。他曾担任美国密西西比州立大学基础科学系的助理研究教授。他在北京大学获得博士学位，并在香港浸会大学（由张宇教授指导）和罗格斯大学（由张彤教授指导）进行了两年的博士后研究。他的研究兴趣在大规模统计机器学习、强化学习、优化、多任务学习以及它们在机器人学、游戏、自然语言处理、计算机视觉和生物信息学等领域的应用。

郑宇于2018年9月加入腾讯Robotics X，目前是控制中心的首席研究科学家和团队负责人，他的研究兴趣包括多接触/多体机器人系统、灵巧抓取和操作、四足行走以及各种机器人算法。

12. 一些感想

写这篇文章真是花了很长时间，可能是自写公众号以来用时间最长的一篇，很多文字是在天上和机场写的（前两周出差四次，坐飞机和等飞机超过5分钟的间隙我都会拿出电脑来）。作为一个过往主要看机器人赛道的投资人，对AI+Robotics这个方向充满期待，非常希望能够和这个领域的创业者和投资人多交流，尤其是上文提到的这些大佬或者大佬的学生们。突然想到一句话，如果要找到你，我先要知道你在哪里，这就是这篇文章的目的。

References：

https://mp.weixin.qq.com/s/VHJs1zPV_Asdbpax-gjDvw

https://mp.weixin.qq.com/s/X60vzoPaEwuDFe2MH-24pA

https://people.ucas.edu.cn/~zhf

https://mp.weixin.qq.com/s/n6SDzKPnzdFgEtycjFKa_w

https://zhuanlan.zhihu.com/p/401682518

https://iiis.tsinghua.edu.cn/people/#jy1

https://mp.weixin.qq.com/s/l_Hl2Ko9phoX1WbX7SFzdA