揭秘阿里达摩院类ChatGPT核心团队人才地图|36氪独家
职场Bonus独家获悉,阿里达摩院中的司罗、徐盈辉均已离职,这也是继去年M6大模型带头人杨红霞之后,另两个大模型主力团队的负责人的离开。伴随而来的,是三个核心团队的“新血”负责人:黄非、赵德丽和周畅。在2022年达摩院一系列的人事变动后,职场Bonus追踪并绘制出新的达摩院及其中大模型主力团队的人才地图。
“通义”,阿里大模型的集大成之作,一号位为周靖人,目前在阿里的位置与腾讯的张正友对标。作为达摩院现任副院长,周靖人负责大AI领域的研究,分管机器智能、智能计算、XR、城市大脑实验室。
在ChatGPT持续引爆热点、用户量飞涨的大背景下,国内各大厂对大模型成果的期待锁定在直接对标的生成式AI上,对自然语言处理、图像、计算能力的发展诉求最为饥渴。对应地,周靖人所带领的机器智能研究院中的“语言技术实验室”、“视觉智能实验室”,和数据计算研究院中的“智能计算实验室”为当前冲向该目标的三大主力团队。
据职场Bonus了解,语言技术实验室在三个团队中的人员占大头,也是阿里NLP研发的核心团队。该实验室为阿里提供包括NLP基础技术、对话技术、机器翻译、应用算法等技术,已在阿里经济体内实现万亿级的日调用。
前任实验室负责人司罗曾是为阿里对外背书AI能力的重要人物,甚至在不久前还出现在各媒体盘点国内大厂AI实力的名单中。司罗被称为最早一批“学术转向工业”的AI科学家之一,自2014年起带领阿里NLP团队取得多项重要成果。在学术领域,他是美国普渡大学计算机系的终身教授,并先后获得美国国家科学基金会成就奖、雅虎、谷歌研究奖、ACM2019杰出科学家等。在阿里,司罗的多重职衔中还包含一项:阿里巴巴副总裁。
与司罗类似背景的AI华人大牛,离职大厂的去向无非有三:创业,回院校,跳入另一家大厂。有业内知情人士向职场Bonus否定了司罗离开阿里后的去向为创业。
现任带领该团队的黄非毕业于卡耐基梅隆大学计算机学院,曾任职于IBM、Facebook,在自然语言处理和人工智能的顶级会议和期刊发表文章40余篇,获美国专利十余项,兼备学术能力和公司技术管理经验。加入阿里后,他领导过AliNLP的基础技术研发和业务落地,云小蜜对话技术和多模态翻译技术,并支持集团内外的国际化业务需求。目前,其带领团队的主要分支包括文本视觉理解理解、翻译算法、多语言NLP应用、智能对话与服务技术、自然语言基础技术、应用算法等。
此外,该团队还有一条产品负责人刘建荣带领的职能线,预计会在阿里将大模型能力向生成式AI产品转化的过程中发挥重要作用。
对于达摩院中的视觉团队来说,最早的领导者可以追溯到已调任高德的任小枫。已离职的徐盈辉,加入阿里前的学术和工作背景并非来自北美或国内,而是在日本:博士毕业于日本国立丰桥技术科学大学,曾任理光日本中央研究所研究。在阿里搜索事业部、菜鸟人工智能部均有任职记录。
我们注意到,目前领导视觉团队的赵德丽,在过往公开信息中显示其职衔为基础视觉实验室负责人,而非“视觉智能实验室负责人”,暂不确定是否实验室名称随方向和定位发生微调。
赵德丽毕业于上海交通大学。曾供职于HTC、小米、微软亚洲研究院、港中文大学多媒体实验室,和黄非一样,他在加入阿里前便积累了算法学术研究和团队管理相平衡的经验。对于算法技术从业者而言,德丽履历含金量的再加分之处在于其对机器视觉和机器学习的基础算法研究经验。当前,德丽的主攻方向在生成模型、多模态学习,和预训练基础模型上。
赵德丽目前职级为P9,带领的团队包含模型优化、视频AI、生成模型、表征学习等方向。
值得一提的是,达摩院在以色列也曾有视觉技术相关的人才储备(比如前Visualead的首席技术官Itamar Friedman等),该团队如今的人员保留情况及与国内团队的配合程度同样令人好奇。
我们将视线转到智能计算实验室。
若将自然语言(NLP)和视觉技术(CV)简单比作大厂冲向“类ChatGPT”产品的左右双轮,那么智能计算实验室里倒腾的“通义”大模型,则是关乎该目标实现速度和效果品质的底盘。
职场Bonus从多位信源处了解到,杨红霞离职后,智能计算实验室名义上的团队负责人是周靖人本人(参考达摩院官网),但实际在带项目的人是周畅——外界倒是对这位年轻、低调的90后所知甚少。
周畅(花名:钟煌)于2012年本科毕业于复旦计算机科学与技术专业,2017年博士毕业于北京大学计算机软件与理论专业,通过校招加入阿里巴巴(难怪企业忠诚度buff叠满),主攻推荐系统、多模态基础模型,擅长领域包括深度学习、图挖掘和分布式计算,自2014年以来在KDD、NeurIPS、ICML、ACL、AAAI等发表学术文章十余篇。领导过的项目包括大众熟悉的手机淘宝购物车/下单后推荐系统,分布式图神经网络学习框架AliGraph的算法部分,以及当下的阿里多模态通用型模型M6、M6-OFA及相关AIaaS服务。
职场Bonus从接触过周畅的从业者口中了解到,“他很想做成通用型更强的大模型,而不是垂直于单一领域和场景”,这一点也正是阿里打造大模型时的理念。
阿里习惯“开放”姿态和“做大、做平台”,想要完成通用大模型基座的建造是件需要“超大力出奇迹”的事。“这周二腾讯云在后厂村办了一场活动,阿里云则会在本周五于杭州举办媒体交流会。”这场战役中,大厂公关团队和技术团队一样有压力。
对于阿里来说利好的是,在近两年大厂裁员和AI的波谷接连出现前,这里曾是华人AI大牛流向的重要一极。人才高地的达摩院对于趋势的出现有较早的预判和准备。为了直观看见阿里在这场前沿技术追逐战中的蓄力和演变,我们赶在阿里的媒体交流会前,站在第三方视角梳理了一下阿里大模型能力的关键时间节点。
这张图的阶段性终点线,对标的或许正是已形成“云-企业软件-AI计算”的高增长曲线和“降低算力成本-提高计算效率”高利润商业模式的美国三大云厂。
这个三月,达摩院里开会的次数特别多。
在OpenAI的GPT-4、百度的“文心一言”接连出牌的这一周,时间和速度的压力与上市大厂们的股价发生了关联——对于手中持有公司股票的P7级及以上员工来说,成果好坏关乎年薪的增值或缩水;对于正在找工作的AI技术人才来说,能做出杰出产品的大牛将成为AI席卷全行业的浪潮下,科技大厂内更受欢迎的金牌招聘官。
36氪旗下职场公众号
真诚推荐你关注
来个“分享、点赞、在看”👇
揭秘阿里达摩院类ChatGPT人才地图
微信扫码关注该文公众号作者