Redian新闻
>
Transformer八子:新硅谷「叛徒」铸就 AI 世界「至尊魔戒」

Transformer八子:新硅谷「叛徒」铸就 AI 世界「至尊魔戒」

科技



Transformer八子的出现与出走,既是起势,也是顺势。


作者 | 椎名
编辑 | Zuri
首图来源:WiffleGif

“One ring to rule them all”
 
这是电影《魔戒》中的一句经典台词,用以形容一枚占据绝对统治地位的至尊魔戒。
 
通用人工智能领域,也曾出现过这样一枚“至尊魔戒”。它的登场,同样有着一个在学术圈来看违背祖训、惊世骇俗的论文标题——“Attention Is All You Need”
 
站在AIGC如火如荼、各种类GPT模型层出不穷的2023年回望,当时这篇论文的标题有多“狂妄”,这枚魔戒的影响力就有多大。且与电影中的至尊魔戒带来彻底的毁灭不同,这枚AGI的“至尊魔戒”指向全新的创造。
 
那么,又是谁创造了这枚“至尊魔戒”?他们如今在何方,是否又在酝酿着新一轮的AI风暴?
 

现在我们都知道OpenAI开启了GPT时代,但再往前追溯,它是站在巨人的肩膀上才能采摘下来的成果,这个巨人的肩膀就包括了2017年发表的这篇“Attention Is All You Need”。

这篇论文提出了名声大噪的Transformer架构,是谷歌著名算法BERT中最重要的部分,更是ChatGPT 末尾的“T”。
 
尔后,Transformer 势如破竹,从自然语言处理机器翻译开始,席卷整个 NLP 领域。

如今6年过去,ChatGPT几乎是Transformer结下的最丰厚的果实,而耕种了Transformer架构的8位作者—— Ashish Vaswani、Noam Shazeer、Niki Parmar、Jakob Uszkoreit、Llion Jones、Aidan N. Gomez、Lukasz Kaiser 和 Illia Polosukhin,大多数现在不在谷歌工作。事实上,其中有七人不再驻足留恋于谷歌这颗苍天大树之下。

我们统计,“Transformer八子”中,“转投小厂派”一人:Lukasz Kaiser则已在2021年加入 OpenAI担任研究员。

 
Llion Jones是8人中目前唯一还在谷歌工作的,只是工作地点换到了日本。他曾打趣地表示,自己对论文作出了最有意义的贡献,是写下了Attention is all you need这个“大逆不道”的标题。

Llion Jones

其中,创业派6人选择了自立门户,且基本上从谷歌一出来就已经获得了 VC 的支持。

本文将着重梳理“Attention Is All You Need”中创业派的最新动向。


01
“真实感”的保鲜期有多久?

原Google Brain研究员Aidan Gomez的创业公司恐怕是里面最受瞩目的。

Aidan Gomez

Aidan Gomez创办的公司叫做Cohere,是一家成立于2019年的加拿大AI创企,专注于提供NLP模型,帮助企业改善人机交互,包括利用Transformer架构快速部署对话式AI聊天机器人、生成式搜索引擎、文本摘要总结、增强向量搜索等。这家公司的另外两位创始人Nick Frosst和Ivan Zhang,也和Aidan Gomez一样具有学术背景,且三位创始人均是多伦多大学校友。
 
Cohere之所以备受业内瞩目,除了创始团队的背景之外,也有一部分原因在于,它的投资者中还有图灵奖获得者Geoffrey Hinton、知名人工智能研究员李飞飞、UC伯克利大牛Pieter Abbeel的身影。这三位在当今人工智能领域都是执牛耳的人物。
 
这样的大牛背书之下,Cohere的融资步伐也十分紧凑,分别于2021年9月获得4000万美元A轮融资,2022年2月获得1.59亿美元B轮融资。

随着生成式浪潮在今年达到一个小高潮,今年5月,据《纽约时报》报道,Cohere更是拿到了2.5 亿美元的融资,估值达到20亿美元,本次投资者包括CRM领导者Salesforce、著名芯片制造商Nvidia、Inovia Capital等。《纽约时报》写道,Cohere也是为数不多在技术层面具备与OpenAI进行竞争的AI企业之一。有报道称Cohere现有员工已经达到近200人。

与Aidan Gomez选择的赛道类似,论文一作Ashish Vaswani在离开谷歌后,也参与创办了一家将NLP技术用于通用助手的公司Adept,并任该公司首席科学家。在谷歌工作后,Vaswani撰写了19篇论文,神经网络是他自2011年以来一直追求的共同主题。

Ashish Vaswani

Transfomer八子中的Niki Parmar也加入了Adept,任CTO。值得一提的是,Niki Parmar 是这个论文 8 位作者里唯一的女性。

 
Niki Parmar

Adept虽然成立较晚(2022年4月才正式成立),但也赶上了这一波AIGC的浪潮:今年3月拿到了3.5亿美金的B轮融资,由General Catalyst和Spark Capital联合领投,Addition、Greylock、Atlassian Ventures、Microsoft、Nvidia、Workday Ventures等机构跟投,还有众多的硅谷明星创业者作为个人投资人投资。
 
这轮融资将Adept的总融资额增至4.15亿美金,公司估值超过10亿美金,晋升独角兽。
 
不过,Adept最新这轮融资已经和Ashish Vaswani、Niki Parmar没什么关系了。因为他们两都在2022年底先后离开Adept,成立了一家名为EssentialAl的公司,目标是为企业构建软件以便于他们使用大型语言模型。今年5月,EssentialAl宣布了由Thrive Capital 领投的800万美元融资。值得一提的是,Thrive Capital 也是OpenAI 的投资者。该公司仍处于隐身模式,尚未推出任何产品。一位接近该公司的消息人士称,Conviction 和天使投资人 Elad Gil 也参与了这轮融资。


值得一提的是,创业派除了上面几位年轻面孔,也不乏已经为谷歌效力20多年的老员工。
 
这位老员工就是Noam Shazeer。他在2018年开发了Mesh-Tensorflow,这是第一个用于在超级计算机上训练大型Transformer的实际系统。
 
Noam Shazeer

2021年,Noam Shazeer 也离开了谷歌,与前谷歌工程师 Daniel De Freitas 共同创立了 Character.AI,致力于开发生成式 AI 聊天机器人 Web 应用程序。迄今为止,该公司已筹集了约 2 亿美元,估值接近独角兽,约有20名员工。


02
“创业派”中的冒险者

都说创业是一场冒险,那么,跨界创业更是冒险中的冒险。
 
Transformer八子中, Jakob Uszkoreit是当之无愧的冒险担当,他的创业去向应该是最具跨界色彩、也是最有难度的。
 
Jakob Uszkoreit

Uszekoreit 被认为是发明 Transformer 架构的幕后推手。GoogleBrain工作期间,他组建了Google助手的语言理解团队,并参与了早期的Google翻译工作。
 
在谷歌工作了 13 年之后,Jakob Uszkoreit也于 2021 年离开了谷歌,他创立的 Inceptive,是一家彻头彻尾的AI+生命科学公司,致力于使用神经网络+高通量实验来设计下一代 RNA 分子。
 
到目前为止,该公司已筹集了 2000 万美元。
 
另一位跨界派Illia Polosukhin,几乎是踏出了AI圈,投入到区块链浪潮中。
 
这位硅谷著名的IT天才,是Google TensorFlow人工智能开源项目的主要代码贡献者,还曾任Google深度学习小组项目主管,带队负责核心搜索算法业务近10年。他在2017年2月就离开了谷歌,创办了区块链底层技术公司NEAR Protocol,吸引了包括a16z、 MultiCoin Capital、Metastable、Coinbase Ventures等区块链领域的著名投资机构。

Illia Polosukhin

这家公链技术公司可以托管去中心化应用程序和智能合约,被誉为“以太坊杀手”, 目前估值约为20亿美元。


03
新的硅谷“八叛徒”故事?

从Transformer八子目前的故事走向来看,已有些许当年硅谷传奇——仙童“八叛徒”的风采。

这件往事里,“叛徒”是一个褒义词。在晶体管刚刚问世之际,8位肖克利半导体实验室核心人物纷纷出走,先后创办了仙童、英特尔和AMD等著名的半导体公司。可以说, 1970 年前后的半导体浪潮中,大部分半导体公司都起于仙童。凭借“八叛徒”的智慧和创新精神不断开枝散叶,微处理器得以普及,计算机变得更加迅速和强大,硅谷更是一举成为了全球半导体产业的中心,引领着信息时代的浪潮。

如今这段佳话过去已近70年,硬件的突破已经出现边际效应,新一轮的信息革命蓄势待发,人类需要更加智能的技术来解决复杂的问题,创新的火种移交到AI领域,硅谷似乎迎来了新的八君子。

我们不难发现,和仙童“八叛徒”类似,“Transformer八子”本身已经积累了丰富的经验和技术知识,他们在谷歌期间推动了人工智能领域的发展,离开谷歌进入到各行各业中,能让这些宝贵的资源和知识更广泛地应用于不同的领域和行业。

更重要的是,这一批离职的AI大牛,同样具备极高的创造力和冒险精神。

他们都曾表达过对现状的不满,追求更高的目标和更具冲击力的创造。

八子中的“创业派”代表Niki Parmar就曾表示,在谷歌,公司整体更注重改进现有产品,而不是创建全新的产品类别。

无论是离开谷歌创办自己的公司或加入其他创新型企业,他们能够更加自由地探索和实践新的想法和概念,从而推动技术的不断进步。

而且这些AI大牛们的离职,也有助于推动合作生态的形成。他们往往与其他优秀的科学家、工程师和创业者紧密合作,共同开展创新项目和研究。这种合作生态能够加速创新的过程,促进技术和思想的交流,为整个行业带来更多的机遇和突破。

正如八子中的另一位“创业派” Aidan Gomez所说:“在谷歌这样的大公司内部进行探索的自由度有限,你无法真正自由地进行产品创新。从根本上说,(这家公司的)结构不支持它。所以你必须自己去建造这个结构。”

这一批离开谷歌的小分队,正在以更加自由的方式探索和发展新的技术和方法,进一步推动通用人工智能的进步。

这样来看,Transformer八子的出现与出走,既是起势,或许也是某种顺势,正如当年的仙童“八叛徒”一样。

文末互动:
你如何评价这八人的创新精神?
👇评论区留言告诉我们哦~

 别忘了点关注,不迷路啊。
👇👇👇

「去滤镜社交」的火热够持久吗?算了吧,下一个


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
CVPR 2023 | 结合Transformer和CNN的多任务多模态图像融合方法往事并不如烟Transformer八子谷歌一个也没留住!最后一名作者已宣布离职创业彻底解决ChatGPT健忘症!突破Transformer输入限制:实测支持200万个有效tokenPackedBert:如何用打包的方式加速Transformer的自然语言处理任务后GPT书:从GPT-3开始,续写Transformer庞大家族系谱大模型的好伙伴,浅析推理加速引擎FasterTransformer炸裂!微软新作LongNet:将Transformer扩展到10亿个Tokensmy tasks in terms of their emotional valueChatGPT的“底座”Transformer诞生六周年:在它之后世界地覆天翻在Transformer时代重塑RNN,RWKV将非Transformer架构扩展到数百亿参数RWKV论文燃爆!将RNN崛起进行到底!可扩百亿级参数,与Transformer表现相当!Transformer八子全部叛逃谷歌!最后一位共同作者月底离职创业transformer高效训练方法一览Transformer开山论文惊天「翻车」?图与代码不一致,神秘bug看傻了ICLR 2023 | Edgeformers: 基于Transformer架构的表征学习框架归来科学匠人 | 胡瀚:成功用Swin Transformer连接CV和NLP主流架构的“破壁人”ICLR 2023|场景三维重建新SOTA!基于3D Transformer的单目场景重建即插即用!Apple新作FastViT: 又快又强的视觉Transformer,端侧部署无压力!基于Transformer的大模型是如何运行的?Meta从全局和上下文学习揭秘12种模态,一个学习框架,Meta-Transformer实现骨干网络大一统比Transformer快4成!Meta发布全新Megabyte模型,解决算力损耗硬伤往事并不如烟ICLR 2023 | Specformer: 基于Transformer的集合到集合图谱滤波器图与代码不一致,Transformer论文被发现错误,网友:早该被指出1000次CVPR 2023 | 正则化方法DropKey: 两行代码高效缓解视觉Transformer过拟合无自注意力照样高效!RIFormer开启无需token mixer的Transformer结构新篇章transformer的细节到底是怎么样的?Transformer 连环18问!VCE物理— transformer的理解和例题CVPR 2023|两行代码高效缓解视觉Transformer过拟合,美图&国科大联合提出正则化方法DropKey星标破10万!Auto-GPT之后,Transformer越新里程碑质疑习总携普大帝共创“百年大变局”:海外华人看中国走向ICML 2023 | 轻量级视觉Transformer (ViT) 的预训练实践手册ICLR 2023 | DIFFormer: 扩散过程启发的Transformer
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。