Redian新闻
>
AWS工程师辞职创建Tensor Search引擎,即插即用HuggingFace版CLIP模型

AWS工程师辞职创建Tensor Search引擎,即插即用HuggingFace版CLIP模型

公众号新闻

机器之心报道

机器之心编辑部

Marqo 是一个多功能且强大的、以用户为中心的搜索引擎,可以集成到任何网站或应用程序中。


不久之前,来自亚马逊的 Tom tomhamer 辞去了软件工程师一职,和其他研究者一起创建并开源了 Tensor Search 引擎 Marqo,其可与用户应用程序、网站和工作流无缝集成。



  • 项目地址:https://github.com/marqo-ai/marqo

  • Marqo 网站:https://www.marqo.ai/


从 Tom tomhamer 的工作经历看,他已经全职加入了 marqo.ai,并担任联合创始人之一。



至于为什么要做这个项目,tomhamer 表示当我们查看文本句子或短段落时,使用向量语义搜索是不错的选择。不仅如此,向量在进行图像搜索时也做得非常好。遗憾的是,视频、长文本和其他更复杂的数据类型,想要继续使用向量表示就有点困难了。


因此他们设想为语义搜索建立一个搜索引擎,类似于 Solr 或 Elasticsearch,无论你扔给这个搜索引擎什么内容,它都能处理它,并可搜索。


Tensor search 涉及将文档、图像和其他数据转换为 Tensor 的向量集合。将数据表示为张量,这样一来我们能够将查询与文档进行匹配,从而像人类一样理解查询和文档的内容。Tensor search 可以为各种用例提供动力,例如:


  • 终端用户的搜索和推荐;

  • 多模态搜索(图像 - 图像、文本 - 图像、图像 - 文本);

  • 聊天机器人和问答系统;

  • 文本和图像分类。



因此,他们构建了 Marqo,它可以使用向量,也可以在必要时扩展到张量,还允许用户灵活地指定特定的分块策略来构建张量。


由于横向可扩展性,Marqo 提供了非常快的查询时间,即使是对数百万个文档。Marqo 使用类似 CLIP 这样的深度学习算法从图像中提取语义,这意味着它可以轻松地处理图像到图像、图像到文本和文本到图像的搜索模式。


不过 Marqo 仍然是一个正在进行的研究,目前支持:


  • DSL 语言查询(包括关键字,范围和布尔查询);

  • 由 NMSLIB 提供的高效近似 knn 搜索;

  • Onnx 支持,多 GPU 支持;

  • 支持排序。


为了支持图像和文本搜索,Marqo 允许用户即插即用 HuggingFace 版 CLIP 模型。不过 Marqo 还不支持 arm64 架构的 docker-in-docker 后端配置。这意味着如果你有一个 M 系列 Mac,你还需要进行进一步操作。


了解更多内容,请查看原项目。


参考链接:

https://www.linkedin.com/in/tom-hamer-04a6369b/

https://www.reddit.com/r/MachineLearning/comments/xk31n8/p_my_cofounder_and_i_quit_our_engineering_jobs_at/



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
HRT:使用Huge Pages进行低延迟优化Rosalía 登意大利版《VOGUE》封面!Hugging Face:通往 AI/ML 淘金潮的高速公路人在中国,国外的房子被盗卖了+ 隔洋惊喜Gender Gap in China’s Science Sector Narrowing, Report Suggests别的简报|美国老师辞职做 OnlyFans,家人和同行都表示支持‘Sleeping Assistants’ Are Talking Chinese Insomniacs to Sleep博士毕业,玩赛车爱摄影,是Principle Architect,也是Project Leader,这位工程师凭啥?China Strengthens Cyber Violence Policing After Teacher’s Death专业择校参考!2023年USNews工程、计算机、商科排名!不要写suggest somebody to do somethingChinese Sailor Returns Home After Circumnavigating the Arctic潞晨科技实习生招聘:AIGC大模型算法工程师、AI编译器开发工程师、前端开发工程师等晚年的追悔— 王芸生和他的《大公报》Haicang Shugang Passageway opens to trafficChina Bans Schools From Forcing E-Devices on StudentsHacking, Hugging, and Healing | AGM 2022, Keynotes & ElectionBatchFormer: 一种简单有效、即插即用的探索样本关系通用模块 (CVPR2022)Zhihu Accused of Using Watermarks in Screenshots to Locate Users香港的“人性化”宏景智驾校招:图像算法工程师、决策规划算法工程师、SLAM建图算法工程师等Global Brands Pitch Sustainable Solutions to Chinese ConsumersLogitech G PRO Wireless RGB Gaming Mouse, HERO 25K Sensor地平线社招:感知融合方向算法工程师、SLAM/3D算法工程师Bunker Hunters: Mapping Shanghai’s Remaining FortificationsAvignon~普罗旺斯的心脏Feep! search:一款面向程序员的搜索引擎,收录信息超2900万页!Cities Offer Huge ‘Group Buying’ Discounts on Unsold Properties极氪智能科技校招:智能驾驶规控算法工程师、智能驾驶感知算法工程师、车联网安全研究员等A Top Archaeology Institute Struggles to Hire Archaeologists澜舟科技社招:算法实习生、算法开发工程师、产品实习生、资深前端开发工程师等bāo huā shēng?bō huā shēng?毛泽东在天安门接见美黑人领袖Ensem:科技驱动,向undruggable的药物靶点宣战 | GGV投资笔记第132期In 2022, Students Are Struggling to Cope. So Are Their Teachers.
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。