Redian新闻
>
​专访Zilliz CEO:只要人类还在拓展认知边界,数据库创新就永远不会停止

​专访Zilliz CEO:只要人类还在拓展认知边界,数据库创新就永远不会停止

科技


解释最新科技进展,报道硅谷大事小情
点击上方“硅星人”关注我们~

作为面向AI原生的向量数据库技术开创者,Zilliz 已经领先全球竞争对手两年。
——
文|杜晨    图片来源 | Zilliz


如果你从事 AI 相关行业,对超大规模非结构化数据的处理有兴趣,那么你应该不会对 Zilliz 这家年轻的创业公司,以及它所开创的向量数据库” (vector database) 感到陌生。

在全球经济整体陷入衰退、科技公司裁员收缩消息频传的最近两年里,Zilliz 逆势创造了融资奇迹,先后完成BB+ 两轮共计 1.03 亿美元融资。其中 B+ 轮高达 6000 万美元,由沙特阿美旗下多元化成长基金 P7 Ventures 领投,之前的 B  4300万美元 则由高瓴创投领投。

Zilliz 的名字在社会上并非家喻户晓。然而在数据库领域,这家全球总部位于美国硅谷的创业公司,却正炙手可热,被行业人士和投资者认为是下一家” Snowflake/Databrick

由于近十年来基于深度学习的人工智能技术发展迅速,复杂数据的量级正在以惊人的速度增长。问题在于这些非结构化数据,类型可能包括文档、图像、视频、音频,可能有着成千甚至上万个维度,让传统数据库捉襟见肘。

向量数据库技术应运而生:通过机器学习手段将非结构化数据表示为向量(一组数字),再结合其他先进的数据库(包括传统数据库)技术,向量数据库能够让使用者更高效地处理非结构化的复杂数据,从中提取价值,驱动新业务和产品,为老业务带来用户体验提升。

而作为向量数据库技术的发明公司,Zilliz 的开源向量数据库项目 Milvus 下载量在上个月刚刚突破了150万,已经获得了超过 1000 家企业用户的支持,并且得到包括eBayShopee、宜家、沃尔玛等头部电商,以及腾讯、快手、Intuit 等知名科技公司的青睐。

这些巨头公司正在使用 Zilliz 的产品更好地挖掘和使用超大规模高维度非结构化复杂数据,提升其核心技术、产品和平台的服务能力和盈利水平。

 MilvusTowhee 等优秀开源项目的基础之上,Zilliz 于近期正式推出了 Zilliz Cloud,一款高效、稳定、安全的向量数据库全托管云服务产品,正式开启了这家 5 岁年轻公司在商业化进程上的全新篇章。

 Zilliz Cloud 以及向量数据库市场的发展,硅星人近日对 Zilliz 公司创始人兼 CEOLinux 基金会旗下 AI & Data 子基金会董事 Charles Xie(星爵)进行了深度采访。

Zilliz Cloud 是一个全托管、高性能、便于规模化的向量数据库即服务,可以被理解为云版本的 Milvus星爵表示,自从7月底 Zilliz Cloud 发布以来,已经有很多企业申请注册参与了首批小范围测试。而这些企业用户当中,不乏正为黑五购物节摩拳擦掌的头部电商企业。

据了解,目前 Zilliz Cloud 基于亚马逊 AWS 服务。星爵预计到今年11月会正式开放公开版本,对所有企业或个人用户开放使用,并且会在接下来逐步接入谷歌 GCP、微软  Azure 等公有云平台,预计在明年上半年提供完整的多云/跨云方案。

Zilliz Cloud 架构图   图片来源:Zilliz

谈到为什么从一家明星开源软件公司转型云服务,星爵表示,Zilliz 首先仍然是一家开源的基础软件公司,但放眼全球同类型公司的经历,会发现云服务和开源的商业逻辑吻合度非常高,用开源做社区引流、培养用户习惯,是一条非常有机的发展路径。
为了能够将向量数据库这一前沿技术进一步普及化,Zilliz 决定开发云端向量数据库服务。尽管 Zilliz Cloud 的成本很高,实现盈亏平衡需要更长的时间,星爵仍然对做云服务这件事十分笃定。

他的信心来自于美国市场客户较强的付费意识和能力。在美国,云产品的溢价能力很高。 MongoDBDatabricks 等知名数据库公司为例,其服务的溢价水平甚至能够达到底层公有云硬件价格的5-10倍。

做云服务的固定成本,比如元数据、安全认证、消息队列等,成本确实不低。但是原则上用户越多,固定成本的摊薄效果越好。我们已经做好了准备,不可能一上来就 break even(取得收支平衡),可能需要几年的时间,实现整体盈利可能更晚,星爵表示,对于我们来说,找到增长和营利的平衡点更重要。同时,在技术研发和产品迭代上我们会继续投入更多资源。

对于 Zilliz 而言,比其他创业公司更早、更多进行战略级投资,早已不是新鲜事。除了近期推出的云服务之外,Zilliz 还是整个向量数据库领域最早斥巨资成立学术研究部门的公司。目前公司的工程团队占总员工 70-80%,而学术研究型员工在工程团队的比例也不小。在过去两年里,Zilliz 在向量搜索方面研究成果斐然,在顶级学术会议 NeurIPS  BigANN 全球挑战赛当中夺冠,研究论文连续两年被数据库顶会 SIGMOD  VLDB 录用, 在向量搜索领域引起了极大关注。

星爵表示,公司在还很稚嫩的时候就投身学术研究,走上这条路实属被迫无奈

他告诉硅星人,公司内部准备做向量数据库的时候大约在 2018 下半年,在当时向量数据库还是一个全新的数据库品类,和传统数据库有巨大的技术差别,带来了很多全新的挑战,学术界也没有任何可以参考借鉴的研究。

大家能看到的计算机科学领域的创业,很多都是在学术界已有的成果上进一步发展,在工程方面做得更好更快。然而对我们来说,不光是工业界,连学术界都还没有探索(向量数据库这一方向)。所以当时,我们感觉就像走在一个荒漠无人区里,每走一步都是做学术界和工业界还没人做过的事情。

正因此,Zilliz 不得不从头开始打造了一支学术研究队伍,跟微软研究院,或者 AT&T Labs——我们当然没法比。我们确实是小公司,我们在无人区披荆斩棘走出来的路形成了这样一条今天所谓的赛道星爵对硅星人说道,

我们公开发表论文背后其实还有一点私心。那就是通过做学术研究,去进一步影响学术界和工业界的人,吸引他们加入到向量数据库这个事业里面来。光靠一家企业的努力,是很难取得行业突破的,只有更多人加入才有多样性,整个行业才能更快产生更多技术突破,实现更长远的发展。

这也是为什么他不把同行看做竞争对手,而是把逐渐开始热闹起来的向量数据库赛道,评价为众人拾柴火焰高

据统计,自从第一款向量数据库开源项目 Milvus 问世并且获得用户好评以来,市场上做向量数据库相关技术的公司越来越多,只从去年开始算,都出现了七、八家相关公司,遍布北美、日本、欧洲等国家和区域。

在星爵看来,更多同行的出现,至少在目前阶段还是一件很值得开心的事情。因为这种热潮恰好证明了向量数据库是下一代人工智能技术的基础设施之一,自己的公司创造了一条正确的赛道,如果你做的市场没有别人竞争,那很有可能就是你自己的方向错了。

非结构化数据是一个多重交叉的领域,本身是数据库技术,同时也和整个 AI 技术大发展所产生的各种不同工业场景有着极强的关联。包括互联网三大核心业务搜广推(搜索、广告、推荐),以及安防、药物发现等市场规模极大,且增长率逐年提升的关键行业,对于非结构化数据的使用都在快速提升。

在星爵看来,虽然今天向量数据库的市场只有一年几亿美元,到 2030 年,整个非结构化数据相关的技术市场规模足以达到百亿美元。

至少在向量数据库这一赛道上,Zilliz 至今保持着技术和产品上的先发优势。由于该公司很早就做了开源项目,现在也推出了云原生产品,并且能够确保性能、查询延迟以及高吞吐的服务,可以水平扩展到处理十亿甚至百亿级别规模的数据——其他向量数据库公司暂时还未具备这个能力。更重要的是,Zilliz 已经在上千家企业用户的帮助下对产品进行了打磨,提高产品的可用性。

总体上,我们估计比同行领先至少两到三年,星爵表示。


星爵(Charles Xie)   图片来源:Zilliz

从产品下载量来看,Milvus 项目开源三年多,到今年 7 月刚达到 100 万下载,到上个月就超过了 150万,预计到年底就会超过 200 万,并且增速在明年仍将进一步提升;从公司团队建设的角度,Zilliz 内部的行业统计数据显示,公司研发和工程师团队总人数比目前所有同行加起来还要多;而从资本层面,星爵认为 Zilliz 截至目前的总融资水平,比所有同行实际融资规模相加还多一倍左右。

由于技术、经济、社会的高速发展,产生的数据越来越多,让数据库行业整体保持着一种长青的状态。以甲骨文为代表的传统关系型数据库行业公司,从上世纪 70 年代生根发芽,直到今天并没有被取代,仍然保持着快速演进。

究其根本,人类每时每刻都在创造新的数据,而且不仅创造速度变快、数量变多,数据的类型也在变得更加复杂和非结构化。

比如对于自然界,我们的观测手段越来越多。再比如现在还有元宇宙这个概念的存在,我们可以随意创造成百上千个平行世界——数据量更加爆发了,星爵表示,在数据处理,更快、更大、更强的需求将会是永恒的,从而促使数据库技术不断迭代发展。

甚至可以说,在未来 50 年以后,传统的关系型数据库仍然存在,并且仍在继续迭代。而对于我们这样的非结构化的数据平台,我认为在未来 20 年里会迎来一个巨大的发展。只要人类还在拓展认知的边界,数据库技术的创新就永不停歇。


注:封面图来自于Zilliz官网,版权属于原作者。如果不同意使用,请尽快联系我们,我们会立即删除。



喜欢这篇文章?



1)点击右下角的“在看”
2)分享到你的朋友圈和群里
3)赶快关注硅星人吧!
关注硅星人,你就能了解硅谷
最新的科技进展和湾区的大事小情,变身最in技术潮人



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
当你经常吼孩子:他不会不爱你,但会停止爱自己!老电影《绿里奇迹》:感动与震撼百度何俊杰:创新就要「既要又要还要」【金融监管】拓展监管边界,完善机构处置安排—评《银行业监督管理法(修订草案征求意见稿)》专访微软游戏CEO:动视暴雪能做手游,元宇宙已存在30多年麦当劳最神秘的汉堡,吃一回就永远忘不了万字专访Arm CEO:凭什么“收割”全球科技巨头?按需生成无限NO,拓展iNO疗法应用边界,Beyond Air切入全球百亿肺炎市场逸仙电商与中大达成联合实验室合作协议,全面拓展Open Lab研发共创生态边界芯片巨头CEO:欧洲半导体投资远远不够数据库“焕然新生”:架构视角下,云原生数据库的创新实践 | Q推荐忙了一天发现这里在打群架。。。 大家都少说两句,在网上反复争执从来都是没有意义的。我也经常跟人争,其实也很傻,知道毫无台故宫文物想疏散给八国联军吗突发!工会停止罢工 学校明日复课!关键时刻各退一步打破边界,创新趋势 | 早鸟最后1天!2022合成生物学与细胞智能制造大会!不花时间选对的人,就永远在带错的人​专访伊朗驻华大使:“我经常去北京的新疆餐馆”阿里云已将 Serverless 数据库大规模落地,这是否代表着数据库的新风向?打破边界,创新趋势 | 早鸟最后3天!2022合成生物学与细胞智能制造大会学不会沟通就永远也升不了职,领导者必学的4大沟通技巧!忍了三年,再不推荐,她就永远消失了​别的简报|一旦蚊子爱你,蚊子就永远爱你【对话Web3投资者】专访 AIKON CEO:拥有真实用例是区块链大规模采用的关键Rosalía 登意大利版《VOGUE》封面!从时速100公里行驶的车上向后发射时速100公里的棒球,球会停止运动吗?图森CEO离奇被炒,股价跳水45% CEO:否认一切渎职指控大企业如何通过创新突破边界,创造第二增长引擎?ROBO-01探月限定版上市:突破你对智能汽车的认知边界边界往往是在极端环境中被拓展的 | 5Y Adventure x 荒岛求生对谈心理学者李雪:只要父母边界清晰,一切育儿问题迎刃而解细颈瓶从头到脚都辱华8点1氪:天猫向ofo及戴威索要5亿借款;优衣库创始人称在中国开3000家店还不够​;国美电器回应已被破产清算迪士尼CEO:虚拟公园永远不会取代主题公园杠上了!安省教育工会誓言:罢工不会停止!周五只是第一天!大英博物馆, 与港台青年的“晚会”,1986伦敦穷游记(2)
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。