谷歌云推出 AlloyDB AI:用先进的向量嵌入和 AI 改造 PostgreSQL
在最近的 Google Cloud Next 中,谷歌在预告中宣布了 AlloyDB AI 是 AlloyDB for PostgreSQL 的一个组成部分,允许开发人员利用大语言模型(LLM)来构建生成式(gen)人工智能(AI)应用程序,并通过内置的、端到端的向量嵌入支持来利用它们的实时操作数据。
早些时候,该公司推出了对 Cloud SQL for PostgreSQL 和 AlloyDB for PostgreSQL 的 pgvector 支持,将向量搜索操作引入到了托管数据库中,允许开发人员存储由大语言模型(LLM)生成的向量嵌入并执行相似性搜索。AlloyDB AI 建立在标准 PostgreSQL 所提供的基本向量支持之上,该公司表示,它为开发人员提供了“创建和查询嵌入的能力,只需几行 SQL 即可找到相关数据,既不需要专门的数据堆栈,也不需要移动数据。”
此外,AlloyDB AI 还为 AlloyDB 带来了一些其他新功能,可以帮助开发人员将实时数据整合到生成式 AI 应用程序中:
通过与 AlloyDB 查询处理引擎的紧密集成,增强了向量支持,比标准 PostgreSQL 查询更快。此外,该公司还引入了基于 ScaNN 技术的量化技术,以在启用时支持四倍的向量尺寸和三倍的空间缩小。
访问 AlloyDB 中的本地模型和 Vertex AI 中托管的远程模型,包括自定义和预训练模型。开发人员可以使用存储在 AlloyDB 中的数据来训练和微调模型,然后将它们作为端点部署在 Vertex AI 上。
与人工智能生态系统的集成,包括 Vertex AI Extensions(将于今年晚些时候推出)和 LangChain,这将提供在 Vertex AI 中调用远程模型的能力,以实现低延迟、高吞吐量的增强事务,使用 SQL 进行欺诈检测等用例。
谷歌云数据库总经理兼工程副总裁 Andi Gutmans 在谷歌博客中写道:
AlloyDB AI 允许用户使用简单的 SQL 函数轻松地将数据转换为向量嵌入,用于数据库内的嵌入生成,并且运行向量查询的速度比标准 PostgreSQL 快 10 倍。与开源人工智能生态系统和谷歌云的 Vertex AI 平台的集成为构建生成式人工智能应用程序提供了端到端的解决方案。
根据 Andi 的声明,Reddit 上的一名受访者问道,谷歌是否是在试图用 AlloyDB AI 拥抱、扩展再消灭(Embrace, extend, and extinguish,EEE)PostgreSQL,另一个答案是:
我想你想说的是,仅仅因为有人,尤其是 [大公司],试图改进 / 整合流行的开放项目,并不意味着它总是 EEE。
我怀疑 EEE 在最初的大部分时间里都是有目的的,即使后来有可能变成那样。以谷歌为例,我认为这将是一个“我们如何为我们的产品增加销售价值”的案例,然后是“这个功能花费了我们太多的资源来维护,致使我们必须削减它,专注于 [新功能]”
此外,其他数据库和公有云提供商也已经支持向量嵌入,包括 MongoDB、DataStax 的 Cassandra 数据库服务 Astra、开源的 PostgreSQL(通过 Pgvector)和 Azure Cognitive Search。后者最近发布了一个新的功能,可以在预览版本中对搜索索引中的向量嵌入进行索引、存储和检索。
最后,AlloyDB AI 可在谷歌云和 AlloyDB Omni 上的 AlloyDB 中使用,无需额外的费用。AlloyDB 的定价详细信息可在定价页面上查看。
原文链接:
https://www.infoq.com/news/2023/09/google-cloud-alloydb-ai-preview/
大模型的出现从根本上改变了数字化转型的赛道,在 InfoQ《超级连麦. 数智大脑》直播中,富滇银行数字金融中心副主任李涛深入探讨了自身对于 AIGC 在金融领域创新方面的思考,分享了银行数字化发展的历程及背后的架构演进。识别下方二维码或关注「InfoQ 数字化经纬」公众号,即可阅读全文。
微信扫码关注该文公众号作者