华为云苏光牛专访:从可信计算看数据库产业变革新趋势
据 IDC 发布的《2023 年全球数据库市场预测》报告数据,到 2023 年,全球数据库市场规模将达到 1062 亿美元,中国市场的规模预计达到 88 亿美元。过去几年来,随着全球经济掀起数字化转型浪潮,数据库作为企业数字化的根基与底座,整个行业也迎来了发展高峰期。短短数年时间,超过 130 款数据库新产品诞生,一大批创新技术和理念如雨后春笋般出现。
在中国,国产数据库产业伴随中国数据库市场的飞速增长也走上了成长快车道。《数据库发展研究报告(2023 年)》显示,近年来,国产数据库技术迅速演进,国内企业及高校的创新能力也在不断突破,行业三大权威学术会议的贡献率在去年已达 40% 之多。与此同时,国家层面还在持续推动数据库领域标准体系建设,为行业有序健康发展打下良好基础。
在这样的背景下,2023 年 7 月 4 日,由中国信息通信研究院、中国通信标准化协会指导,中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)与 InfoQ 联合主办的“2023 可信数据库发展大会”在北京召开。大会吸引数千名业界专家、学者参与,共同为数据库行业未来发展出谋划策。本次大会上,华为云数据库服务产品部总经理苏光牛发表了题为《华为云 GaussDB,做企业数字化的坚实数据底座》的演讲,分享了华为云 GaussDB 数据库的最新进展。会后,InfoQ 专访了苏光牛,围绕可信计算、GaussDB、国产数据库发展趋势等主题做了深度探讨。
数据库是一个发展历史超过 40 年的传统 IT 技术门类,过去 40 年间,数据库产业历经关系型、非关系型、开源、分布式、云原生、可信计算等诸多创新浪潮,行业一直处于快速迭代进步的发展状态。如今,数据资产化、要素化进程加快,企业数字化转型方兴未艾,如何充分利用海量数据资源,切实达成降本增效目标成为企业提升竞争力的关键所在;数据库产业也在这样的环境中焕发勃勃生机,新技术、新概念层出不穷。
数据库行业的创新潮流,也是与企业现实的需求变化息息相关的。例如,可信计算是当前国内企业选择数据库时比较关注的一项属性。过去,大批企业一直在使用 Oracle 的数据库产品,用于对安全性、可靠性指标要求极高的场景和领域中。当这些企业考虑使用其他厂商的创新产品替换 Oracle 数据库时,提出的一项硬性要求就是新产品的安全、稳定性等指标相比 Oracle 不能退步。与此同时,企业数据库的更换周期往往较为漫长,企业希望供应商能够为产品提供长期支持,同时尽可能避免潜在的法律和技术隐患。如果供应商大量使用开源技术,同时又缺乏对这些技术的掌控,企业在选型时就难以免除后顾之忧。
在国内,重要领域的自主创新是近几年的大趋势。处于这样的环境中,企业也希望新采购的数据库产品能够与国产硬件完美兼容,最好能充分利用国产硬件的特定功能、设计来提升性能表现,因此数据库的软硬协同能力也得到了越来越多的重视。另一方面,虽然云原生数据库的概念近年来非常热门,但很多企业并不希望自己选择的数据库与云供应商深度绑定,他们更希望数据库与云基础设施解耦,前者能够自由适应从私有云到公有云的各种基础设施环境。类似地,诸如智能运维、AIGC 等智能化创新虽然也吸引了企业的目光,但决策者更重视的是这些创新在实践中对数据库各项指标的提升效果。
总体而言,今天的数据库产业正处于创新高峰期,但用户侧对层出不穷的新概念接受程度有所差异。用户更多关注的是数据库产品的整体表现,关心这些产品能否满足自身在实际业务场景中的需求。不同行业、不同场景对数据库的要求可能大相径庭,一项产业创新很难同时为所有用户带来满意的效果。可以预期,数据库领域的创新将向场景化、实用化的方向持续转型,这一过程中对供应商的要求也将日益提升。
在数据库行业持续创新的背景下,中国数据库品牌也迎来了难得的发展良机。国产数据库产业自上世纪末起步以来,历经二十余年发展,已经成为全球行业中一支不可忽视的创新力量。包括华为云 GaussDB、腾讯云 TDSQL、阿里云 PolarDB 等在内的一批国产品牌在过去几年中发展势头喜人,不仅在互联网行业内大面积替代了国外老牌厂商,在金融、电信等关键基础行业也遍地开花,为国家信息技术战略的推进与企业数字化进程提供了持续动力。
国产数据库的崛起并非一蹴而就。一方面,过去十年来国内 IT 产业持续高速发展,数据库供应商实力稳步提升;另一方面,全球数据库行业正在从单体架构向分布式架构转型,企业对数据库性能等指标的要求快速提升,大量技术创新短期内爆发,给国产品牌创造了弯道超车的机遇。总之,国家相关措施为国产数据库提供了充足的市场拓展空间。
今天全球有近五百家数据库供应商,来自中国的厂商已占据三分之一。这些国产力量中,华为云 GaussDB 是过去几年内发展态势较好、创新能力较强的代表性产品。GaussDB 是华为云自主创新研发的企业级分布式关系型数据库,具备企业级复杂事务混合负载能力,支持分布式事务强一致、同城跨 AZ 部署、数据 0 丢失,支持 1000+ 扩展能力、PB 级海量存储。同时拥有高可用、高可靠、高安全、弹性伸缩、一键部署、快速备份恢复、监控告警等关键能力,能为企业提供功能全面,稳定可靠,扩展性强,性能优越的企业级数据库服务。
与很多数据库产品主要基于开源技术不同,GaussDB 的内核由华为云自主设计,华为云对其有着完全的掌控能力。正因如此,GaussDB 在可信计算、软硬协同等属性上有着独特的优势,这些优势赢得了包括国有 6 大银行中 5 大行等关键基础行业的很多重要企业客户,为国产数据库的发展树立了值得参考的榜样。本次大会上,苏光牛总经理也在演讲与会后专访中分享了 GaussDB 的成功经验,让我们从行业前沿视角看到了国产数据库是如何在激烈的竞争中脱颖而出,赢得客户认可与同行尊敬的。
在信息技术相关政策推动下,金融、电信、能源、交通等关键基础行业正在积极探索使用国产数据库的技术路线。国产数据库因此获得了重大的历史机遇,但也因此遇到了很大的技术挑战。由于关键基础行业对数据库的安全性、稳定性、可靠性等指标要求极高,而国外厂商在这些领域有着数十年的深厚积累,想要在这些方面达到甚至超越国外产品,对国产数据库来说是非常困难的。同时,由于这些行业的运维管理往往有很多约束,供应商很难通过驻场运维的方式解决各类突发问题。这就对数据库的核心技术水平,尤其是可信计算指标提出了非常高的要求。最后,虽然关键基础行业的数据库潜在市场很大,但企业往往倾向于在少数几家实力较强的品牌中做出选择,中小厂商很容易被排除在外。
华为云发展 GaussDB 时同样遇到了上述问题。为此,华为云将可信计算放到了数据库研发的重要位置上,通过全方位的可信设计,结合华为云的技术优势打造符合关键基础行业需求的国产数据库优秀产品。
华为云对可信计算的理解是非常深刻的。GaussDB 的核心代码是华为云自主研发,并不依赖市面上的开源数据库选项,对 GaussDB 具有完全的掌控能力,可以针对企业关注的核心指标进行深度优化,实现与替换的目标数据库持平甚至更高的安全可靠表现。同时,自主研发意味着 GaussDB 可以大幅简化依赖数据库的应用的迁移过程,同时保证迁移完全可控。大量基于 Oracle 接口的应用无需高昂的成本就可以向 GaussDB 平滑迁移,过程中出现任何问题都能得到华为云的快速响应。
另一个非常重要的层面,很多中小厂商基于开源数据库改造的产品需要跟随开源技术栈进行更新,一旦开源技术栈停止迭代,这些产品就很难继续发展下去,对客户来说是不可接受的。大量依赖开源技术还存在另一个隐患,当用户在全球范围部署这些数据库产品时,有可能因为供应商内部的合规管理存在缺陷,导致产品被各国监管机构审查乃至禁用。例如,某款数据库使用了某些开源代码,却没有按照许可协议做后续的开源工作,这就可能在境外引发法律诉讼,给客户带来很大的麻烦。相比之下,GaussDB 非常重视安全可信工作,在全球范围都能为用户提供坚实保障。
在华为云看来,可信软件意味着企业要从产品定义开始,在整个软件开发链要做到来源可信、过程可信、结果可信,端到端实现可信,出现问题可快速溯源,从根本上解决问题。正所谓过程可信才能做到结果可信,华为在内部已经建立了成熟完善的可信研发框架,每一位工程师都在这种文化影响之下规范自己的日常工作。从编码习惯到审核流程,所有软件开发项目都会严格遵守安全可信的细致要求。正是这种将可信计算贯彻到日常工作中的企业文化,让可信成为了 GaussDB 的最大优势之一。
确保了产品可信,符合关键基础行业的严格要求后,GaussDB 的另一大关注点就是软硬件协同。GaussDB 的软件核心架构自主可控,很容易对包括华为自主研发的鲲鹏服务器在内的国产硬件架构进行深度优化。充分发挥这些自主硬件的潜力,从而满足企业对数据库性能的苛刻要求。同时,GaussDB 还会根据企业用户,尤其是金融行业用户的反馈进行改进,进一步增强关键能力。例如,银行用户要求数据库在持续大并发写入下性能基本无抖动,GaussDB 研发了 Ustore 存储引擎,基于 In-place update 更新机制,最终实现了实践部署中高负载下无抖动的目标,且进一步节省了存储空间。
如今,GaussDB 在高性能、全密态和稳定性三项行业测试中都取得了非常好的表现。其中,GaussDB 在通过中国信通院“可信数据库”的全密态数据库基础能力测试时,将加解密性能损耗控制到了非常低的水平;在分布式事务数据库稳定性测试中,GaussDB 在经过一周混沌工程理念的压测工具持续故障注入后,展现出良好的韧性表现;在分布式事务数据库性能测试中,GaussDB 在所有测评项目中成绩最优。这些成绩很大程度上归功于 GaussDB 核心自主、软硬协同的优势,也证明华为云选择了一条正确的数据库发展路线。
安全、可靠、全流程可信、易迁移、高性能、长期技术迭代与维护保障,这些特性综合在一起,为 GaussDB 的成功打下了坚实基础。事实上,GaussDB 在赢得关键基础行业的众多头部用户的青睐后,这些用户的实践经验也让其他领域的用户信心大增,进而将 GaussDB 作为自身数据库换代的第一选项。
值得一提的是,GaussDB 在数据库的生态建设方面的成果也非常值得借鉴。首先,华为云高度重视与应用开发合作伙伴的适配对接;其次,华为云吸引了很多数据库工具厂商为 GaussDB 开发迁移和运维工具;GaussDB 与众多高校也有深度合作,在高等教育阶段就注重数据库开发和应用人才培养,为企业用户储备人才资源,保障人才供给;最后,GaussDB 还在加强运维层面的合作伙伴建设,共同为客户提供高水平运维服务。
大批生态合作伙伴的加入,为 GaussDB 带来了数量更多、更加完善的行业解决方案,对客户的吸引力自然与日俱增。GaussDB 正在为越来越多的企业构建数字化转型的底层基础设施,为企业降本增效、提升长期竞争力构筑坚实底座。GaussDB 的成功经验,也为其他国产数据库厂商乃至更多领域的软件开发商提供了很好的参考与借鉴。
正如华为云苏光牛在本次大会上的演讲所言,“数据库在企业数字化转型过程中扮演着底层支撑的重要角色。”围绕这一目标,GaussDB 在现有成果的基础上制定了未来的长期发展规划。首先,GaussDB 会进一步简化迁移和部署流程,让企业能够快速完成迁移,同时保障迁移可控。其次,GaussDB 将在部署形态上支持公有云、混合云与轻量化部署,使客户在任何场景下都能使用 GaussDB。
多样化的部署形态看似与业界云原生数据库的大趋势相悖,但在实践中这是非常必要的。很多关键基础行业用户更希望将数据保存在企业内部的物理设施上,尽可能减少对公有云的依赖。还有不少中小企业则要求新一代数据库实现轻量化,降低部署成本,适应更多场景需求。因此,GaussDB 的这一发展规划,实际上也是整个行业接下来需要考虑的重点问题。
如今,分布式数据库已经成为数据库换代的主流选项。但分布式数据库带来的额外性能损耗,以及更多物理机器引入的更大运维负担都是不可忽视的。华为云为此也在持续努力,持续优化分布式数据库的性能、降低损耗,同时设法简化运维,让用户可以更平滑地从单体过度到分布式架构。
此外,GaussDB 在全密态、版本更新服务、运维工具链等方面都在稳步前进。对于行业关注的 AIGC 热点,GaussDB已经在产品中利用 AI 技术加强运维监控能力,降低运维人员负担,使故障解决在 AI 的帮助下进一步无感化。
GaussDB 的发展规划可以在相当程度上代表整个数据库行业未来的发展趋势。纵观国产数据库市场,GaussDB 无疑是国内品牌中的佼佼者。华为云坚持自主研发、可信合规,坚持以客户需求为导向,努力建设数据库良性生态的发展路线已经赢得了用户的认可,为同行树立了良好的榜样。放眼未来,国产数据库在各个行业全面替代进口产品已成定局,国产数据库品牌正处于历史上最好的发展机遇期。可以预期,包括 GaussDB 在内的一批国产数据库优秀品牌将在这一过程中崛起为全球一流水平,并为数据库产业的持续创新与良性发展做出不可忽视的贡献。
回顾华为云 GaussDB 的实践经验可以发现,在数据库这样历史悠久、用户需求复杂、技术难度较大的领域中,想要单纯凭借一些新潮概念、小范围技术优势或低廉的定价就赢得用户认可是很难的。企业非常清楚数据库在数字化转型过程中的重要地位,针对这样牵一发而动全身的 IT 基础设施,管理层往往不会轻易做出更换供应商或更新换代的重大决策。相比创新概念带来的模糊收益预期,企业更重视新品数据库能否顺利迁移、能否保障稳定可靠、性能提升是否可持续等现实问题。
正因如此,数据库供应商只有努力提升自身技术实力,密切关注市场需求动向,开发出能够切实满足用户需求的产品,同时为用户提供稳定、可预期的服务与技术生态,才能把握难得的历史机遇,赢得可观的市场份额。数据库创新不能是无源之水,那些真正脚踏实地、在实践中体现优势的数据库产品,将是市场竞争的最后赢家。
微信扫码关注该文公众号作者