2024年6月21日,生成式AI领域的领头羊OpenAI和一家很多小伙伴可能是头一次听说的初创公司Rockset同时发布了一则公告:OpenAI收购了Rockset!
关于这次收购
OpenAI对Rockset的收购是OpenAI公司历史上规模最大的一笔交易。尽管OpenAI并没有公开具体的交易金额,但根据Rockset融资的历史数据,截至去年8月,Rockset获得的融资总额在1亿美金左右(投资方包括Icon Ventures、Sequoia和Greylock),投后估值在1亿到5亿美金之间,因此这次收购的价值可能高达5亿美金(约36亿人民币)。另外,Rockset还有包括Meta和JetBlue在内的客户,后者使用Rockset作为其航班延误预测聊天机器人的组成部分。OpenAI官方表示,这次收购的核心目的是将Rockset的技术整合到OpenAI的产品中,以增强其数据处理和分析服务的能力。Rockset是一家由前Facebook工程师创立于2016年的公司,专注于提供实时分析数据库服务,其技术特别擅长于处理和分析大规模的半结构化数据。Rockset的技术亮点在于其“向量搜索”(vector search)功能,这项技术对于AI驱动的应用如推荐引擎、语音助手和聊天机器人等至关重要。Rockset的数据库能够自动在任何数据上构建“多维索引”(Converged Index),实现大规模的高性能搜索和分析,支持实时SQL查询,帮助开发者构建数据驱动型应用。OpenAI通过这次收购,不仅将获得Rockset的核心技术,同时也将Rockset的团队成员纳入了自己的行列。Rockset的CEO Venkat Venkataramani表示,加入OpenAI后,他们将助力解决人工智能应用在数据库方面所面临的挑战。OpenAI的首席运营官Brad Lightcap也表达了对Rockset技术的高度评价,并期待将其整合到OpenAI的产品中,以提供更高效的数据服务。“Rockset’s infrastructure empowers companies to transform their data into actionable intelligence. We’re excited to bring these benefits to our customers by integrating Rockset’s foundation into OpenAI products,” said Brad Lightcap, OpenAI COO.
“We’re excited to be joining OpenAI to empower users, enterprises and developers to fully leverage their data by bringing powerful retrieval to AI,” said Venkat Venkataramani, CEO of Rockset.
关于初创公司Rockset
Rockset是一家位于美国加州圣马特奥的云原生实时分析数据库公司,成立于2016年。这家公司由在Facebook、雅虎、谷歌、甲骨文和VMware等公司积累了丰富经验的软件工程师创立,他们拥有大规模数据管理和分布式系统的专业背景,这使得Rockset在实时搜索和数据分析领域具有独特的技术优势。成立背景
Rockset的创立初衷是为现代应用程序提供快速、灵活且易于使用的数据分析解决方案。创始人看到了传统数据库技术在处理实时数据和云基础设施方面存在的局限性,因此开发了Rockset,旨在填补这一空白。公司自成立以来,致力于开发下一代云数据基础设施,旨在使实时数据分析变得更为简单高效,帮助企业更好地利用数据,加速决策过程,并推动数据分析领域的创新。发展历史
自成立以来,Rockset迅速发展,获得了包括Icon Ventures、Sequoia和Greylock在内的多家顶级风险投资公司的投资。根据Crunchbase的数据,Rockset在上一轮融资中筹集了超过1.175亿美元的资金。公司规模也从最初的小团队发展到拥有51-200名员工的中等规模企业。主要业务
Rockset专注于提供实时搜索和分析数据库服务,核心产品是一个基于云的实时分析数据库,它支持对结构化、半结构化、地理和时间序列数据的查询,能够实现毫秒级的查询延迟,同时消除了运维负担。这些功能使得Rockset成为数据密集型行业中的首选,特别是在金融科技、游戏、电商和物流等领域。通过其高效的Converged Index存储格式和SQL查询能力,Rockset提供了低延迟的搜索、过滤、聚合和连接操作。这些技术特点使得Rockset能够处理复杂的实时数据应用,如推荐引擎、聊天机器人、风险分析和物流跟踪等。- 无服务器和完全托管:简化了配置、集群调配、反范式化和分片/索引管理。
- 全功能SQL:支持对JSON、时间序列、地理空间和向量数据的SQL查询。
- 多维聚合索引:存储、计算和导入三层分流,满足实时高并发查询需求。
技术成就
Rockset引入了向量搜索功能,这使其在AI和机器学习应用中具备了更强的竞争力。向量搜索支持实时的元数据和向量嵌入索引,这是实现语义搜索和生成式AI应用的关键组件。公司还实现了计算-计算分离架构,大幅提升了实时分析的速度和效率。- RocksDB-Cloud:Rockset的嵌入式持久化存储引擎,基于广泛使用的RocksDB,支持自动数据复制到云存储。
- 计算与存储分离:利用云存储的弹性资源,实现了存储与计算的独立扩展。
- 云原生架构:采用容器化部署和Kubernetes系统,提高了资源管理的效率。
结语
尽管OpenAI最近动作不断,网友们还是在OpenAI的帖子下面发出了灵魂拷问:GPT-4o
的实时语音和Sora模型什么时候能发布?