Redian新闻
>
老黄参投!MIT华人女科学家融资2亿美元!1万块H100训超千亿参数AI智能体

老黄参投!MIT华人女科学家融资2亿美元!1万块H100训超千亿参数AI智能体

公众号新闻

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【目标检测和Transformer】交流群

转载自:新智元 | 编辑:Aeneas 好困

【导读】刚刚,这家华人女科学家的创业公司晋升为独角兽,英伟达等投资2亿美元。AI智能体,果然引领着AI投资的全新方向。

刚刚,又一家AI独角兽在硅谷诞生!
这家华人女科学家创办的公司名为Imbue,近日获得了2亿美元融资,估值已达10亿美元。
而Imbue也是少数创始人为女性的独角兽之一。
不仅如此,Imbue还手握1万张英伟达H100显卡,硬通货已经不愁了。
是的,你没猜错,这家AI独角兽,英伟达又投了!
英伟达高级科学家Jim Fan也开心地发推祝贺:去年我们还一起在NeurIPS上一起谈论Avalon和MineDojo呢,现在Avalon背后的公司,已经成为独角兽了!
这个故事告诉我们,不要忽视你在顶会上遇到的每个其貌不扬的研究者,说不准在哪天,他们的公司就会获得顶级融资,诞生下一个Sam Altman。
没有一份钱创收,但已筹集数亿,这样的奇迹,只有在硅谷才会发生。

英伟达看好

目前,Imbue正在训练的「超大规模」大模型,参数已经超过1000亿,并且,Imbue目前手握1万张英伟达H100 GPU。
公司还未发布任何产品,仅在去年秋天发布了Avalon开源训练环境。

Imbue联合创始人Kanjun Qiu和Josh Albrecht

不过,Imbue的此轮融资金额,是先前已筹集金额的10倍。
由亿万富豪Jed McCaleb成立的非营利组织Astera Institute领投,参投方包括英伟达、通用汽车旗下自动驾驶公司Cruise首席执行官Kyle Vogt、Notion联合创始人Simon Last等。
现在,Imbue的融资总额已经达到2.2亿美元,已跻身为最近几月融资状况最好的初创公司之一。少数在它前面的,就是Cohere(4.35亿美元),Adept(4.15亿美元),以及AI21 Labs(2.83亿美元)。
参投方中最引人注目的名字,无疑就是英伟达。
就在今年,英伟达已经连投7家AI独角兽,包括Adept、Coreweave、Cohere、Inflection、Runway、AI21 Labs,以及Imbue。

瞄准AI智能体

一家还处于早期阶段的初创公司,只有20名员工,还未发布任何面向公众的产品,却赢得诸多硅谷知名AI投资人的青睐,这是为什么?
原因就是,Imbue选择的路线并非AI基础模型,而是——AI智能体!
大模型导致的生成式AI爆火之后,市场被彻底盘活,信心满满的投资人也在急切地四处寻找下一个热点。
AI智能体,就是被诸多AI大佬和科技巨头看好的方向。
今年加入OpenAI的大牛、前特斯拉AI总监Karpathy曾表示:AI智能体,代表了AI的一种未来!

Karpathy曾将AutoGPT称为下一个前沿
AI智能体是一种自动的智能体,以最简单的形式中在循环中运行,每次迭代时,它们都会生成自我导向的指令和操作。因此,它们不依赖人类来指导对话,并且是高度可扩展的。
作为模拟人类抉择来完成复杂任务的计算系统,AI智能体无疑是比大语言模型更具想象力的路线。
其实,早在今年三、四月,就有过一轮AI智能体的大爆发,仿佛巧合一样,在短短两周内,斯坦福西部世界小镇、BabyAGI、AutoGPT、GPT-Engineer等多个智能体,就如雨后春笋一般冒出来。
甚至有人发出号召:别卷大语言模型了,咱们是卷不过OpenAI的,但要说起AI智能体,他们并不比我们有经验多少。说不定一不小心,自己就能卷成AI智能体赛道上的「OpenAI」!
这不,Imbue这就来了。

投资人:慢慢探索,不着急落地

不过,创始人表示,Imbue虽然在开发一些产品,但并不打算将大部分产品投入生产。
Imbue希望,这些模型和工具是一种方式,帮我们在未来通向AGI,让人们能有一个创建自己定制模型的平台。
对于市场,Imbue的态度并不急切,这一点,从融资上也可以看出——
主要投资方,是致力于科技项目的非营利组织Astera Institute,而非趁热一拥而入AI项目的风投公司。

两位创始人表示,在融资过程中,他们有意避免了与风投公司会面。
这是因为,在他们看来,Imbue的工作离真正商业化落地或许还需数年,风投公司不会有这种耐心,而非营利组织会对他们的商业化时间表更加宽容。
最大投资人、亿万富豪Jed McCaleb表示,自己在看完Qiu和Albrecht建立AI智能体的PPT后,觉得非常满意,因此大手一挥,拍板决定投资。
当然,他也明白,这是一场豪赌:为了把研究推进到下一个阶段,把实验室的工作产品化,光GPU的投入,就要烧掉不少钱。
Qiu和Albrecht也非常有信心,在十年后,PPT上的成果,很可能就变为人们日常的应用,而且,很可能用不了十年。

训练推理基础模型

在Imbue的官方博客里,他们是这么解释的——
目前,AI系统在代替用户完成简单任务方面,能力非常有限。这其中的一个重要阻碍因素就是「推理」。
可以说,强大的推理能力是AI智能体实现有效行动的必要条件。
对此,我们可以进一步细分成:处理不确定性的能力、知道何时改变方法的能力、提出问题和收集新信息的能力、推演情景和做出决策的能力、提出和放弃假设的能力,以及处理现实世界复杂而难以预测的本质的能力。
要想为「会推理的AI智能体」量身定制基础模型,就意味着不仅要利用LLM所提供的强大功能,同时还要以详细、实用的方式了解这些模型是如何训练的,以及它们在哪些方面会出错。
也就是说,一方面需要创建专门用于强化模型推理的预训练数据,另一方面还要开发出能够让推理结果更加可靠的技术。
为此,团队采用了全栈式的方法:训练基础模型、制作实验智能体和界面原型、构建稳健的工具和基础设施,以及了解模型如何学习的理论基础。
- 模型
训练并优化超大规模的模型(>1000亿参数),进而在推理基准测试中获得出色的表现。
而最新一轮的融资让Imbue获得了其他公司难以企及的能力:搭载着约1万张H100的计算集群,可以实现从训练数据到架构和推理机制等所有内容的快速迭代。
- 智能体
在模型之上,Imbue设计了内部使用的智能体原型(主要用于编码)。同时,也在尝试各种各样其他的智能体,进而获得强大、可靠的通用智能体。
- 界面
如今的AI聊天界面基本都是拟物化的。而团队认为,有很多关于智能体稳健性、信任和协作的核心问题,是可以通过重新发明交互界面重来解决的。
此外,可以理解世界的AI智能体,也提供了一个重新思考人类与计算机交互方式的机会,从而创造出更能支持并赋予我们能力的系统。
- 工具
优秀的工具能加速迭代的循环。
为此,团队在为自己构建工具方面投入了大量精力:无论是用于修复类型检查和线程错误的简单智能体原型,还是智能体和模型之上的调试和可视化界面,抑或是更加复杂的系统(比如CARBS可以自动完成大部分超参数调整和网络架构搜索)。
- 理论
要想为智能体创建一个既能提供稳健基础,又能保持长期安全的模型,就必须发展深度学习理论。
为此,团队将研究重点集中在特征学习,以及理解大语言模型学习过程背后的核心机制上。
目前,团队已经发表了不少关于自监督学习的理论基础,以及神经网络等系统学习的基本规律的文章。

会推理和码代码的AI智能体


不过,在开发出人人可用的AI智能体之前,团队首先针对自己的使用场景进行了深入的研究。
并以此了解如何才能不断地改进专门为智能体设计的推理模型,以及如何才能构建出让智能体更加可靠的工具。
于是,在首批智能体原型中,有很大一部分都是围绕着团队的核心工作——代码。
具体原因如下:
- 使用是发明的必要条件
要想让AI智能体与人类一起稳定地工作,最佳途径就是制造能够用于日常工作的AI智能体,并在此过程中解决各种问题。
- 代码可以提高推理能力
首先,在代码上进行训练有助于模型更好地学会推理。其次,由于编程问题非常客观(代码要么通过测试,要么不通过),因此可以为更广泛的推理能力测试提供了一个相对理想的平台,从而让团队能够了解到他们对底层系统的改进是否有效。
- 代码对于行动非常重要
生成代码是智能体与计算机上进行交互的有效方式。更强的编码能力可以直接转化为更有可能成功完成复杂任务的智能体。例如,会编写SQL查询从表格中提取信息的智能体,要比直接尝试汇集相同信息的智能体更有可能满足用户的需求。
- 具有重要的战略意义
随着不断的改进,智能体可以接管更多的工作,从而加快研究和工程的速度。这样,不仅有助于软件系统的构建,而且还能帮助建立起一个组织的原型,看看真正可用的AI智能体会是什么样子。
目前,团队并没有把这些「代码智能体」投入生产的打算。不过,他们预计会在一段时间之后,公开这些工具和模型,让任何人都能创建出自己的AI智能体。

真正的个人计算机,让我们自由、有尊严、有能力做自己喜欢的事情

真正有用的AI智能体,实际上就是一个能理解目标、会主动沟通并在背后为我们工作的计算机——从而消除想法与执行之间的障碍。
而我们也不必再盯着屏幕,而是可以自由地探索自己的好奇心,发现宇宙的规律,创造艺术杰作,更深入地了解彼此,或者只是花时间享受生活。

团队成员


虽然只有20人左右,但Imbue的团队成员可谓卧虎藏龙。
联合创始人兼首席执行官Kanjun Qiu在MIT获得了学士和硕士学位,其他成员除了AI外,甚至还具有神经科学、等离子体物理学等背景。

创始人Kanjun Qiu和Josh Albrecht认为,团队所具有的背景知识广度,是他们的一项优势。
虽然根据华尔街见闻报道,硅谷有几位投资者怀疑这支小团队是否有能力运营一家真正的AI研究实验室。
但在了解Imbue创始人的人看来,风投偏向于支持几个有著名背景的创始人,因此这种担忧并不重要。

部分投资者和顾问
参考资料:
https://imbue.com/

点击进入—>【目标检测和Transformer】交流群


ICCV / CVPR 2023论文和代码下载


后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:ICCV2023,即可下载ICCV 2023论文和代码开源的论文合集

目标检测和Transformer交流群成立


扫描下方二维码,或者添加微信:CVer333,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF等。


一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群


▲扫码或加微信号: CVer333,进交流群


CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉,已汇集数千人!


扫码进星球


▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
《孙子兵法》,中国军师和非洲军阀《别君叹》&《爱人先爱己》将蛋白质语言模型扩展到千亿参数,深度解读百图生科、清华xTrimoPGLM模型阿里等大厂豪掷50亿美元买英伟达芯片;寒武纪被爆裁员,硬件部分只保留少数员工;小米曝光64亿参数AI大模型|AI一周资讯VinFast第三季营收3.4亿美元:交付1万辆车 净亏6.2亿美元华人女科学家命丧蒙特利尔老城区大火!警方:现场发现助燃剂,属于刑事案件!融资2亿美元!这家互联网+护理平台已拥有35万注册护士,服务超过1500家机构C轮融资1.55亿美元,谷歌、英伟达参投,为什么它会是OpenAI、Cohere最大对手?GPT-4版微软Win11下周二见;千亿参数生物医药大模型面世;DALL·E 3模型将接入Bing丨AIGC大事日报女科学家的非科学门槛华人女科学家的“开挂”履历:当选上院士,还是诺贝尔奖评委AI企业Imbue融资2亿美元:估值超10亿美元 英伟达为投资方9.20直播 | 智能科学家生态联盟成立大会暨智能科学家论坛碾压Llama2!微软13亿参数phi-1.5,单个A100训练,刷新SOTA全面拥抱大模型!腾讯正式开放全自研通用大模型:参数规模超千亿、预训练语料超 2 万亿 tokens华人女科学家命丧老城区大火!警方:现场发现助燃剂,有人下黑手!礼来参投,种子轮融资2600万美元,RNA编辑初创瞄准眼科遗传病,可一次注射靶向数千种突变智能电动汽车初创品牌宾理BeyonCa获数亿美元投资;极兔速递港交所上市,市值超千亿港元丨10.21-10.27投融资周报WAIC十大AI商业落地趋势:大模型新玩家融资难度升级,云计算洗牌战来了新品:华为GT 4 科学减脂 心脏提醒 智能手表328.99元!送智能体脂秤!最近看的几个烧脑的电影生成式AI全球投融资220亿美元,美国占比89%!OpenAI贡献超60%,中国AI芯片投融资世界第一,超美国两倍安进、英伟达参投,FP创办的生成式AI制药公司获超2亿美元融资,共开发17条管线,1个项目已进临床重瓣天竺葵,美丽大爆炸老黄参投,MIT华人女科学家融资2亿美元!1万块H100训超千亿参数AI智能体苏州旭创宣布参投基金:出资2000万元【500VC投融资周报】北极雄芯完成超亿元融资;橙科微电子完成2亿元C+轮融资;显微智能完成亿元级A轮融资重磅!纽约发钱!4000美元!8000美元!975美元!快看看你符合哪个!!!智源:70万预算从头开发千亿参数大模型,挑战成功微博(24)—起早10万美元+26天,一个低成本千亿参数LLM就诞生了马斯克直播试驾特斯拉FSD V12!世界首个端到端AI自动驾驶,1万块H100训练斯坦福大学分拆,加州AI制药初创融资2亿美元,计划推进首条管线进临床不用4个H100!340亿参数Code Llama在Mac可跑,每秒20个token,代码生成最拿手|Karpathy转赞0参数量 + 0训练,3D点云分析方法Point-NN刷新多项SOTA
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。