Redian新闻
>
达摩院损失 AI“大将”,预训练大模型 M6 技术负责人杨红霞离职

达摩院损失 AI“大将”,预训练大模型 M6 技术负责人杨红霞离职

公众号新闻


整理 | 刘燕

阿里达摩院损失 AI“大将”。

日前,据 Tech 星球报道,阿里达摩院大模型带头人杨红霞已于 9 月初离职。InfoQ 发现,杨红霞于不久前注销了钉钉账号。

全球最大 AI 预训练模型 M6
背后的技术负责人

杨红霞 博士是超大规模多模态预训练模型 M6 的技术负责人。

M6,英文全称是 MultiModality-to-MultiModality Multitask Mega-transformer,6 个 M,简称 M6。

顾名思义,M6 大模型主打多模态、多任务能力,其目标是打造全球领先的具有通用性的人工智能大模型。

2021 年 3 月,达摩院发布了国内首个千亿参数多模态大模型 M6,引发海外关注。OpenAI 前政策主管 Jack Clark 公开点评道:“这个模型的规模和设计都非常惊人。这看起来像是众多中国的 AI 研究组织逐渐发展壮大的一种表现。”

2021 年 11 月,阿里 M6 宣布 升级 至万亿参数,并在全球范围内首次大幅降低了万亿参数超大模型训练能耗,更加符合业界对低碳、高效训练 AI 大模型的需求。

据悉,通过一系列突破性的技术创新,达摩院团队仅使用 480 卡 V100 32G GPU,即训练出了规模达人类神经元 10 倍的万亿参数多模态大模型 M6,与英伟达、谷歌等海外公司实现万亿参数规模相比,能耗降低超八成、效率提升约 11 倍。

这一技术突破将极大降低万亿模型训练门槛,让大模型研究和工业化落地进入更加普惠的时代。

针对此次升级,达摩院资深算法专家杨红霞曾表示,“接下来,M6 团队将继续把低碳 AI 做到极致,推进应用进一步落地,并探索对通用大模型的理论研究。”

以下为 M6 发展历程:

  • 2021 年 1 月 —— M6 百亿参数模型达成,国内首个百亿规模多模态大模型

  • 2021 年 2 月 —— M6 千亿参数模型达成,国内首个千亿规模多模态大模型

  • 2021 年 5 月 —— M6 万亿参数模型达成,全球范围内首次大幅降低了万亿参数超大模型训练能耗,且成为国内首个实现商业化落地的多模态大模型

或因内部项目调整?

据报道,杨红霞此次离职是因为个人家庭原因。

Tech 星球的报道中称,此番杨红霞离职,被认为是达摩院对一些难以落地的商业化项目进行调整。一位阿里云内部人士透露,“达摩院很多项目都是远看很牛,近看难以落地”,虽然二者都在云与科技,但是达摩院的项目与业务产研隔的较远,也很少和云服务一起对外售卖。所以达摩院每个项目的落地应用和商业化程度,很多是个谜。

去年 5 月,阿里宣布 AI 大模型首次商用,M6 成为国内首个实现商业化落地的多模态大模型。经过一段时间的试用,M6 作为 AI 助理设计师正式上岗阿里新制造平台犀牛智造,通过结合潮流趋势进行快速设计、试穿效果模拟,有望大幅缩短快时尚新款服饰设计周期。M6 还已应用于支付宝、淘宝等平台,参与跨模态搜索、文案撰写、图片设计等工作。

此前,阿里一直强调,达摩院不用有盈利压力。但 2022 年,互联网企业普遍降本增效,达摩院也进行了诸多调整。在杨红霞之前,阿里集团副总裁、阿里云研究院副院长肖利华,达摩院副院长 金榕 等都已相继离开阿里。

杨红霞是 AI 领域杰出的人工智能科学家。资料显示,杨红霞 2007 年本科毕业于南开大学,获统计学学士学位。其后她去往美国杜克大学统计科学系攻读博士学位,师从 David Dunson 教授。杨红霞拥有顶级论文 40 余篇。曾任 IBM Watson 研究员、Yahoo!主任数据科学家等职。她曾带领团队获 2019 世界人工智能大会最高奖卓越人工智能引领者(Super AI Leader,简称 SAIL 奖),曾获 2022 年福布斯中国科技女性 50 强的荣誉,获得 2020 年国家科学技术进步奖二等奖。


你也「在看」吗? 👇

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
晚点独家|抖音经办负责人朱时雨转任生活服务负责人,抖音战略团队或部分分拆曝阿里达摩院大模型 M6 带头人杨红霞已离职:个人选择,非行业原因直播课预告:多模态预训练大模型OmModel及视觉应用开发曝阿里达摩院大模型M6带头人杨红霞已离职:个人选择,非行业原因阿里巴巴达摩院-机器智能技术-基础视觉智能团队招聘|2023 校园/实习CVPR 2022|达摩院开源低成本大规模分类框架FFC硬核 ,这才是写给技术负责人的 AI 落地方案!杭州/北京内推 | 阿里达摩院AliceMind语言模型团队招聘算法实习生阿里达摩院招3D重建方向RI实习生买房风波 (1)文本智能校对大赛冠军方案!已落地应用,来自苏州大学、达摩院团队五年磨一剑:阿里达摩院重磅推出AI模型社区「魔搭」,300+模型全面开源独家丨知名AI科学家叶杰平、薄列峰,加入阿里达摩院​达摩院文档级关系抽取新数据集和五元组抽取新任务常见骨关节疾病的中英文对照360第三季营收21亿:净亏近16亿 财务负责人离职阿里达摩院Research Intern实习生招聘2022最火的AIGC落地怎么用,阿里达摩院团队深度解读男生穿背心做核酸被全校通报批评!负责人:甘肃天冷,这是对自己健康不负责别做让人鄙视,天天活在欺骗中的人研究人员开发在小型设备上训练大型神经网络 保护隐私如何向大模型注入知识?达摩院通义对话模型SPACE系列探索腾讯发布万亿大模型训练方法:最快256卡1天训完万亿NLP大模型加速训练定制化BERT,ExtremeBERT工具包助力轻松快速预训练令人心动的AI offer:特斯拉、阿里达摩院、荣耀等2023校招、社招等你来Huge and Efficient! 一文了解大规模预训练模型高效训练技术独家:原腾讯XR业务负责人沈黎离职属实,但XR业务仍在持续推进;Rokid获1.25亿人民币投资招人!阿里巴巴达摩院基础视觉智能团队【2023校园招聘】达摩院决定交出家底儿理想汽车人事再动荡,AI算法负责人王轶伦将离职|36氪独家在阿里达摩院搞了四年数据库,我来聊聊实际情况 | 卓越技术团队访谈录“魔搭”来了!一文深度解读达摩院推出的AI模型社区解放台湾反攻大陆都为中国睾丸【庭院种菜】扒一扒网红肥料: 浴盐利用自动损失缩放更稳定地训练大模型
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。