云器科技喻思成:创业就是不断否定自己之后再肯定自己 | OMEGA访谈录
技术创新的浪潮一波接一波,云原生数据尤其是AI的普及,也让市场对数据量的需求与日俱增。为此企业不得不投入更多人力成本、时间成本和财务成本去构建数据平台,以达到不断推进业务发展的目的。然而,企业自行完成数据平台架构并非易事,其复杂程度和高额成本使得不少企业望尘莫及,无法实现数据价值最大化,数字化转型进程也遥遥无期。
诞生于2021年的云器,虽然年轻,但却给了这些企业顺利完成数字化转型的契机。2023年7月20日,云器科技举行了首次对外的产品发布会,并且推出了新一代“多云、一体化”的数据平台——云器 Lakehouse,让无数期待完成数字化转型的企业看见了曙光。云器基于增量计算构建的“Single-Engine”一体化平台,能够在湖仓架构之上,实现批、流、交互三种分析模式的统一。开箱即用、高性能、低成本的数据平台不再是痴人说梦,企业借此能够有效将数据变为生产力,进而向科技型数字化企业转型。
本次OMEGA访谈录,我们特地邀请到云器科技的创始人兼CEO喻思成。他曾任甲骨文(Oracle)公司的全球副总裁以及阿里巴巴集团副总裁,还开创了阿里云的国际业务。通过本次访谈,他和我们一起聊了聊以下问题:
1. 为何离开大厂投身创业?
2. 选择数据平台方向创业的原因?
3. 云器产品能够为客户带来什么好处?
4. 云器在海内外的数据安全问题如何解决?
5. 云器的内部管理方式和工作流程是什么?
6. 来到OMEGA的收获分享
“我想要去创造一匹属于自己的马”
先请您介绍一下自己和云器这家公司。
我叫喻思成,是云器科技的创始人兼CEO。创业之前,我在BEA、Oracle、阿里云工作过,2021年选择和一群志同道合的小伙伴一起创立了这家公司。我们主要是想打造一个下一代数据平台,甚至我们希望它是世界级水平的。我相信很多同学已经比较熟悉数据平台,包括我们现在已经用了很多年的数据仓库,以及因为AI对数据平台的需求而兴起的对数据湖的需求。应该说这是一个集成的市场,但是这个市场随着云的出现尤其云原生技术的出现和多云的普及,已经经过了几代革命,所以我们希望自己能够成为更下一代、更创新型的数据平台。
其实您在职场上已经到达一个非常高的高度,为何还要投身创业?
我很感谢我过去待过的平台,给了我很多经历背景,促使我能够发展得相对快一些。但我觉得这就像是人借马力,马力更多。平台能力占主导,我个人能力是次要,而我内心拥有一些创业的冲动,我想要去创造一匹属于自己的马。尽管挑战很大,但我觉得人还是要在挑战甚至痛苦中成长,因为成长是人最终极的需求。
您创立云器时国内数据平台处于什么阶段?为何您会选择数据平台的创业方向?
我以前在Oracle做了很多年,当时基本处于Oracle对数据库盖棺定论的一个产品时代。你会发现在数据库RDBMS发展的几十年里,最后我们会沉淀出一个由一家公司提供的非常标准化的产品,这个产品基本上是给客户开箱即用。我们可以大概理解为从攒机时代逐渐变成类似一体机时代,非常商品化,有一点像一家公司的高科技消费品。
其实数据平台也发展了大概好几代,而我们今天所处的时间点很好,它甚至会成为一个极简化的完全消费品级的大数据平台,让我们的企业能够在上面进行数据仓、数据湖的大数据平台处理。我们正好处于一个非常好的时代。我觉得大数据平台在过去这几代的发展里,大家有很多开源的产品,然后我们把它传承一个能够处理客户大量数据需求,能够做BI报表的产品。但是我觉得还不够极简化,我们需要将其打造成一个一体化、多元化的消费品级别的IT产品。
今天我们的技术和时代发展给了我们一个时机。既然技术已经到了一个节点,那我们肯定要往前走一步,产品也要跟得上。我们之所以取名为“云器”,也是希望我们能够尽己所能推出自有的新技术和新理念,构建中国的云上国之重器,打造出属于中国的原创数据平台技术。
云器诞生之前,国内外是否已经有大厂在做类似尝试?
有的,我觉得美国在某种程度上作为世界第一的市场,有时候也在引导后面市场的发展。我们很明显看到的有Snowflake、Databricks这两家公司,一家公司已经上市,还有一家公司即将上市,这给了我们显而易见的信号,那就是给客户提供一个极简的、一体化的、跨云的大数据平台,这个技术趋势几乎是不可逆转的。
创业过程中,您是否遇到过一些此前从未预想到的挑战?
当然,挑战非常大。在平台上打工,就如同开车,这时你要花的大部分力气,实际上是协同各个零件成为一辆能够朝一个方向去的车。创业则像造车,是从零开始的痛苦过程,尤其是被客户批判时的心理感受差别。曾经我为了收一笔14万人民币的尾款,被客户指着鼻子骂了将近两个小时,都是在批判我们的产品,而且产品确实出现了一些问题。在公司时被客户骂的感觉和创业时被骂的感觉还是不一样的,创业时被批判更刻骨铭心。因为客户反映的每个问题都处在自己亲手建立的产品之上,所以内心会有能力被彻底否定的挫败感和戳心感。我记得之前我还在阿里时,王坚博士有一句话就说得特别精准:“在创业的过程中,永远是在极度的自信和极度的不自信之间来回徘徊。”
让电商数据高峰不再高不可攀
数据平台是如何作用于我们的日常生活的?
很多大型电商平台,实际上他们就是在从各个维度采集和客户相关的所有数据,当所有这些数据产生时,很自然地就在前台有一套数据采集的过程,这可能就跟大家息息相关了。数据采集后就开始数据加工,所有原材料数据进来以后,并不是立即就能够让前端进行消费。整个数据加工链路里实际上有很多技术和学问,要把它真正用于消费环节,过程中也消耗了50%以上的资源成本。
使用云器产品对客户来讲成本会有什么变化吗?
我觉得成本主要来自于两方面:
第一是云资源成本,我们现在提供的更多是一个完全丰俭由人的SaaS化提供方案,客户不需要担心任何软件、硬件带宽存储的资源,只需要在云器一家购买,云器通过技术帮企业节省大量(50%甚至以上)成本;
第二是运维人员成本,我们可以完成技术托底,运维人员可以大量被解放出来,去做让技术、数据产品能够发挥更多为业务产生价值的一些事情。
云器的获利方式是什么?
实际上我们主要的毛利并不在于搬运这些云的资源,而是借助技术赢得红利,让我们的软件凭借同样的资源能够跑得更快。我们利用云资源的潮汐效应,实际上可以在你不忙的时候给别人用,别人不忙的时候可以给你用,等于整个云的群体客户产生一个分享效应。
这对技术要求高吗?您觉得国内能对标云器技术水平的公司大概有几家?
非常高,实话说我们现在还没有看到有相对应技术能力的公司。你要能够在多个云上提供秒即拉起、即开即用的服务,然后是按秒计费、丰俭由人的海量弹性,同时又能够在同样的硬件资源上跑出可能几倍的效率,从而节省时间和硬件成本。我们给客户最极简的端口,客户直接用就行,不用买硬件,不用买存储,不用买带宽,不用去管理,不用去做运维,拥有这种技术能力的其他公司,我们几乎没有看到。当然我们也希望有这样的友商出来,大家一起推进这项事业。
云器的客户大多数和电商相关吗?
电商包括跨境电商是我们很重要的一批客户,因为他们有大量数据,所以需要一个数据处理平台,而传统处理平台很多时候不能满足其现有需求。比如双十一极其高的数据高峰,就需要云器这样一个丰俭由人的完全SaaS化的云方案。
做未来数据时代的云上“数据厨房”
什么是“湖仓一体”化?
「湖仓一体」即Lakehouse,是Data Warehouse(数据仓库)和Data Lake(数据湖)两个词的组装。Data Warehouse是一个比较传统的概念,它的数据都是分门别类放在那里,不是结构化的,甚至是半结构化、非结构化的。如果我们把lake和house组装并且存放企业所有数据,这样不仅可以往回看做出BI的报表,同时也可以往前面去做出AI模型。
在没有“湖仓一体”化之前,大家是怎么操作的?
实际上云器有两个技术创新,一个叫“一体化”,一个叫“湖仓一体”。在一体化之前,甚至在今天很多时候,我们为了去做这样的数据平台,实际上要买好几个产品把它组合起来。因为不同数据的结构设计就是不一样,所优化的东西也不一样,因此很多时候数据要存两份,数据还要从这里搬到那里,实际造成了很大的浪费和隐患。我们在这里面做到了很大的一个创新点,实际上是一套引擎,一套数据,但它可以同时做这个事情。打比方就是追求运货需要大卡车,追求速度需要轿车,而我们同时具备运更多货和速度更快的能力。
AI掀起巨大浪潮的今天,数据行业又将如何被影响?
从总体发展趋势上来看,数据正逐步成为一个公司(尤其是一个科技型公司)最核心的生产资料。尤其是AI/大模型的出现,使得这个势头更加不可阻挡。今天可能印证了我们当时的一个想法:我们要做一个同时适用于AI和BI的数据平台。因为AI本身也是一个涉及数据库的科技,所以它对于下面的数据平台需求也非常强烈。作为一个数据平台,我们两年前出发时就已经想好云器要使用“湖仓一体”的存储结构。
对于企业来说肯定希望一套数据既能够为数仓BI服务,为以前的数据加工处理流程服务,同时也能够为AI模型服务,这样就可以把所有数据融合为一体。而AI的出现使得这个数据处理平台变得更加有意思,而且使得市场变得更大。
在您看来,未来「数据」将在人类社会中扮演怎样的角色?
终究会有一天,数据不仅仅成为自己家的核心生产资料,也成为整个社会所有企业的核心生产资料。因为只有云才能把大家聚集在一起,在这种情况之下,很多新的技术场景很有可能会出现的。你可能能够看到更多行业数据加工出来的新的报表,以及它产生的新型的AI应用,会对你的企业业务产生更多创新性的使用。
如果在不远的未来,我们能够成长为一个大的数据平台,那么在这个大数据平台上,将会有海量的客户数据,把这些数据放在云上“数据厨房”里加工,我们为之提供最大的生产力,生产效率。我们希望到时候在这个数据价值的“炼金台”上,大家能够去做更多百花齐放的创新型数据应用。
数据强监管时代,做好隔离,打造安全区
在目前以开源为主流的开发者生态里,云器选择闭源的背后原因是什么?
早期某个新概念出来的时候,基本上用开源的比较多,因为这样社区的迅速迭代能够让它推进的速度很快。但后面这已经不是一个新概念,现在对我们来说一体化变得极其重要,我们必须保证里面的代码都是极其可控的,但是开源就会让我们无法左右社区的发展方向。我们在对客户进行分析过后得出结论,对我们来说技术可控并提供给客户极简方案更加重要,我们的客户会选择去买一个他完全可信任的一体化产品,从而解决他的痛点。他要集中在他的业务上面,而不是花大量人力来看你的代码,所以我们选择闭源。
云器涉及精准的海量数据,在海内外是否会面对数据监管挑战?
肯定是会的。为了规避风险,我们现在实际上是把国内的操作方式和国外的操作方式从合规性上做好隔离。归根到底,满足当地的合规性的需求就能够应对数据监管挑战。
云器的国际化扩张有哪些关键问题必须解决?哪个区域最难做?
如果要做国际化扩张,就要解决几个关键问题:第一,组织问题;第二,文化问题,因为每个地方的文化是不一样的。我们现在所看到的很难的区域分成两种:一种是规模较小的单一市场,一种是难度很大、封闭性高的美国市场。美国市场应该是世界第一的市场,但它特别难做,如果你想要进行规模性扩张,那你必须有真材实料。其实我觉得目前没有一家To B中国公司可以在美国产生规模型扩张,当然字节是一个例外,它其实是To C。美国本身社会太过于内向性,很难接受一个新的东西来挑战它。
面对美国、中国、新加坡三个市场,云器的发展计划是?
我们肯定还是分三步走:第一步,把中国做好;第二步,着眼以新加坡为中心的整个亚洲市场;第三步,进入以美国为中心的欧美市场。
中国市场的数据服务生态是什么样的?如何看待这个市场?
中国是一个特别好的市场,同时也是一个比较难的市场,也比较卷。中国的To B市场的确还是跟别的市场不大一样,首先它对于开源付费的接受程度不同,你得了解这个市场对好的产品的付费方式,到底是希望SaaS化,还是在IDC安装OP版本的许可,还是针对每个行业进行定制化,所以中国市场其实不是一个特别容易拓展的市场。
我觉得还是对本地市场要有充分的认知、耐心,甚至去拥抱它不一样的地方,当然也要把它朝着国际化方向去引导。最后还是会去朝着合理化方向去发展,但是你必须要有一个发展眼光来看这个事情,它还是有一个发展过程。因为中国有自己的Cost Structure(成本结构),有自己的Ecosystem(生态系统),这个和美国差别很大。你要有充分的思想准备,要对这个Ecosystem(生态系统)有充分的了解,这样你才知道每个行业、每个技术场景下之下,他们对于数据平台的选择,很多时候并非按照很简单的常理推论就可以得出来。
管理是一种需要因材施教的手段
您觉得严厉在技术公司里是一个好的管理风格吗?
我觉得要分团队,看场所。对研发来说,拍桌子不是一个好的行为,但是对于业务团队来说,还是需要有一定的狼性血性。如果你太温柔,相反不能帮助业务团队成长,对他来说可能就是在你这浪费了好几年。很多时候严厉只是一个手段,最主要的是你给业务团队提出的不仅是你的要求,还得是让他觉得很骄傲的要求。要让他是在你的平台通过你的支持和管理,实现了他自己以前都不可想象的一个业务目标。
云器好几个地区的人无法面对面工作,那云器在组织上、文化上是怎么能够达到大家统一的呢?
首先,我们还是所有工作都非常电子化,虽然是远程工作,但实际上时时刻刻能够感受到工作伙伴在身边。我们使用飞书,无论是文档文化、沟通文化还是所有的审批流程,都是实时在线,这样大家能够永远感觉彼此互相在身边。我们的价值观就是共同成长。云器要跟客户共同成长,同时员工也要跟平台共同成长。
您作为曾经的职场扛把子,请给今天的职业经理人们/职业小白们分享一些经验。
在现在的职场发展过程中,很多人可能勤奋有余,但是战略思考可能欠缺一些。就现在职场而言,如果让我给很多刚刚进入的年轻人一点经验的话,我总结的一个对我来说最有用的点就是——要做时间的朋友。因为要做时间的朋友,所以对你来说基石就变得非常重要,也就是说你在基石上面做出的选择有时比勤奋更加重要一些。
来到OMEGA,您有什么收获吗?
我真心觉得OMEGA这个课程班很有意义,不仅不收钱而且没有作业(笑)。这里的课程和同学都很高质量,我从中学到了特别多东西。我可以很负责任地说,纪源资本的投后是我接触的投资机构里做得最好的。OMEGA的课程老师也非常好,会针对我们这些同学来讲一些我们所需要的知识,而不是讲那些高大上的噱头。所以我非常推荐大家在OMEGA认真上课,真的能够学到很多以前没有接触的知识,能够真正在创业过程中运用并解决问题。
微信扫码关注该文公众号作者