Redian新闻
>
增强AI能力:谷歌云在托管数据库中集成向量搜索

增强AI能力:谷歌云在托管数据库中集成向量搜索

公众号新闻

作者 | Renato Losio
译者 | 明知山
策划 | 丁晓昀

谷歌云最近在 Cloud SQL for PostgreSQL 和 AlloyDB for PostgreSQL 中增加了对 pgvector 的支持。这个扩展为托管数据库带来了向量搜索操作,允许开发人员存储大型语言模型(LLM)生成的向量嵌入并执行相似性搜索。

Cloud SQL 和 AlloyDB 现在可以与 Vertex AI 上的生成性 AI 服务配对,帮助创建能够感知应用程序和用户状态的 AI 应用程序。谷歌高级产品经理 Sandhya Ghai 和产品经理 Bala Narasimhan 解释说:

向量嵌入是一种数值表示,通常用于将复杂的用户生成内容(如文本、音频和视频)转换为易于存储、操作和索引的形式。这些表示由嵌入模型生成,如果两个内容在语义上相似,它们各自的嵌入就会在嵌入向量空间中彼此相邻。然后,向量嵌入会被索引,被用于基于相似性进行有效的数据过滤。

例如,开发人员可以使用 Vertex AI 的预训练模型在文本和图像之间生成嵌入,并将它们存储并索引到数据库中,简化查找相似记录的过程。

用户现在可以使用 CREATE EXTENSION 命令在现有的数据库中安装 pgvector 扩展:

postgres=> CREATE EXTENSION IF NOT EXISTS vector;CREATE EXTENSION
postgres=> CREATE TABLE embeddings(  id INTEGER,  embedding vector(3));CREATE TABLE
postgres=> INSERT INTO embeddings        VALUES                (1, '[1, 0, -1]'),                (2, '[1, 1, 1]'),                (3, '[1, 1, 50]');INSERT 0 3

来源:https://cloud.google.com/blog/products/databases/using-pgvector-llms-and-langchain-with-google-cloud-databases

正如 Ghai 和 Narasimhan 所解释的那样,这一新功能还可以帮助开发人员利用预训练的 LLM:

我们需要了解的是,LLM 没有状态的概念……嵌入允许你将大型上下文(如文档或历史聊天记录)存储在数据库中,并过滤它们,以便查找最相关的信息。然后,你可以将最相关的聊天历史记录或文档片段输入模型来模拟长期记忆和业务特定知识。

谷歌云发布了一个 Colab Notebook 和一个视频,用 pgvector、开源框架 LangChain 和 LLM 构建 AI 驱动的应用程序。谷歌高级软件工程师 Saket Saurabh 演示了如何在示例 Python 应用程序中添加生成式 AI 功能,他写道:

pgvector 扩展还引入了用于对向量执行相似性匹配的新运算符,你可以用它查找语义上相似的向量。这样的运算符有两个:

‘<->’:返回两个向量之间的欧几里得距离……

‘<=>’:返回两个向量之间的余弦距离

在过去的几个月中,谷歌云并不是唯一一个瞄准向量数据库的云供应商,Amazon RDS for PostgreSQL 也支持 pgvector 扩展,微软还展示了如何将 Azure Data Explorer(ADX)作为向量数据库,并讨论了几种连接到向量数据库的连接器。

原文链接:

https://www.infoq.com/news/2023/07/gcp-databases-vector-search/

声明:本文为 InfoQ 翻译,未经许可禁止转载。

今日好文推荐

甲骨文火上浇油、SUSE投入1000万美元,多方“围剿”红帽:“红帽负担不起?那我们来!”

5天内用户数破亿、增速碾压ChatGPT,Twitter劲敌Threads是如何构建的?

Python吞噬世界,GPT吞噬Python!ChatGPT 上线最强应用:分析数据、生成代码都精通

LLM对程序员的冲击和影响

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
腾讯云发布向量数据库产品,AI Native成关键词丨最前线谷歌 CEO:谷歌 25 周岁,搜索仍是核心,AI 是最大变革训练大模型之前,你要了解下向量数据库、算力集群、高性能网络技术底座吗?被黄仁勋和OpenAI接连点名,这家向量数据库公司终迎「iPhone时刻」|年度AI对话你从哪里来?这个世界上有哪一个当妈的不会哄自己孩子的腾讯云大模型领域新动向!向量数据库作为独立产品推出,8月正式上架【固定收益】全市场杠杆率下行,券商减持债券幅度较大——7月中债、上清债券托管数据解读北美有的,中国也有了!Zilliz Cloud向量数据库云服务重磅登场与向量数据库 Pinecone 工程经理聊 ChatGPT 插件ChatGPT 都推荐的向量数据库,不仅仅是向量索引没有 “专业” 的向量数据库,大模型就玩不转了吗?AI 原生向量数据库 : 大模型的“黄金搭档”, 能提供“记忆海绵”【广发策略戴康团队】全市场最全策略数据库:八位一体数据库谷歌云推出AlloyDB AI:用先进的向量嵌入和AI改造PostgreSQLZilliz创始人兼首席执行官星爵演讲实录 | 向量数据库:大模型的记忆体向量数据库会是 AI 的“iPhone 时刻”吗?| 《架构师》9月刊开放下载给大模型持久记忆!GitHub 2万星向量数据库云服务升级,国内云产品7月上线向量数据库?不要投资!不要投资!不要投资!ChatGPT盛行的当下,向量数据库为大模型配备了一个超级大脑向量数据库再迎新变化!头部公司产品更新引热议,开启大模型落地新范式ChatGPT 和 OpenAI 都在用的 Redis,是如何从传统数据库升级为向量数据库的?母亲节忆妈妈向量数据库内核面临的技术挑战及应对措施【固定收益】全市场杠杆率上行,保险加仓明显—5月中债、上清债券托管数据解读青玉案 暮色里大模型商用新解法:CVP架构崛起,向量数据库破圈并非所有向量数据库都生来平等 - 找到属于你的向量数据库两个多月完成全自研:大模型之争,从 GPU 卷到了向量数据库与向量数据库Pinecone工程经理聊ChatGPT插件谈谈美国警察的训练和素质连代码都没写就敢要融资:被ChatGPT带火的向量数据库,带来了一大波造富神话AI帮助人类打破十年算法瓶颈:谷歌 DeepMind 发现更快排序算法,已集成到C++库星环科技向量数据库从 0 到 1 技术实践:提升数据处理的精确度是重中之重百川发布530亿大模型,融入搜索能力:第一时间内测体验已来
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。