盘点5大技术板块、洞察56个开源项目:InfoQ研究中心带你探秘中国开源数据库
在中国数字化变革和数字经济发展大背景的推动下,作为基础软件,数据库日益成为中国数字经济发展背后最重要的基础设施之一。在形势日益复杂的国际环境下,自主可控的行业共识也日益被中国技术界所认可。一直以来,国家持续出台关于数据库的利好政策:
国家 863 计划设立了“数据库重大专项”等注重研究国产数据库的计划。
“十一五”宣布要以信息化带动工业化,同时数据库进入“核高基”重大科研专项,以数据库作为主营业务的初创公司大量出现,云计算厂商也开始布局云数据库,国产数据库进入再一次的高发展期。
经 InfoQ 研究中心统计,目前国产数据库产品数量已经超过 250 款。在此期间,数据库开源也正在帮助国产数据库实现快速和高质量的发展。TiDB、OceanBase、openGauss 等开源数据库快速展露头脚。InfoQ 研究中心研究发现目前中国开源数据库项目主要可以分为 5 大技术板块,分别为关系型数据库、图数据库、时序数据库、空间 & 向量数据库和键值数据库。目前国产数据库开源项目达到 56 个,约占整体的 22%。
经过研究 InfoQ 发现,中国开源数据库中,仍然以关系型数据库为主,占比超过 60%。同时已经产生了面向电商、金融、游戏等行业的相对成熟的解决方案。为保证不同行业场景下的计算存储等需求,关系型开源数据库多致力于追求高扩展、高可用、强一致、高兼容、高性价比、容灾架构等技术特征。
非关系型开源数据库计算场景与关系型开源数据库形成了明显差异,针对于图、时序、向量等非结构化数据提供了具有领先性的解决方案。与关系型开源数据库不同,非关系型开源数据库起步较晚,但其整体与云上和微服务等基础设施的适配度较高。在特定的非结构化数据计算场景下,数据计算能量也更大。
此外,培育开源库项目的企业类型,既包括自身业务存在大规模数据存储和处理的互联网企业,例如华为、阿里、腾讯、京东;也包括了早期就定位数据库服务的科技创业企业,例如 PingCAP。为了更好地了解国产开源数据库的发展情况,InfoQ 研究中心结合国内外两大代码托管平台 GitHub、Gitee 的相关数据,从代码健康和社区活跃等角度分析现有开源数据库项目,并选取了获得 Gitee 指数第一名的 openGauss 和 InfoQ 开源项目指数前两名的 TiDB和 TDengine 作为案例进行研究。
备注:InfoQ 开源项目指数主要由代码健康和社区活跃两大维度构成,每个维度下设 4 个子指标,共计 8 个子指标,用于多维度评价开源项目,主要数据来源包括 Github 和 X-Lab 的 openleaderboard。
社区运营方面,多元化体系化的社区运营方式是数据库领域开源社区健康发展的重要保障。TiDB 和 TDengine 则都采取了内容、活动、用户三大运营方式相结合的方式,通过产品文档、视频教程、技术论坛、技术峰会等形式激发开源社区活力。
在此基础之上,以 openGauss 为例,在成立初期即构建了相对健康的社区治理结构,并且在全产业链范围内邀请企业成为理事会单位。健康的社区基础架构不断赋能社区生态体系,目前 openGauss 已经构建起了由伙伴生态、高校生态和开发者构成的协同发展生态体系。
技术和应用场景方面,数据库领域开源社区正在不断针对应用场景特征和关键需求(研发环境更复杂、安全性要求更高、使用场景更多元),研发对应的高性能技术。
openGauss 场景化技术研发方面注重技术的四高特征——即高性能、高可用、高安全、高智能。同时为了提升可拓展性,满足更多元(全场景、全产业链等)的使用需求,进行了插件化、可观测内核、资源池化和数据安全四大架构创新,大大提升了软件在实际生产环境中的工作效能。
TiDB 则立足金融级数据库高要求的特性,聚焦金融行业关键业务领域发展,在安全的基础上,输出高性能高稳定产品。TDengine 则利用时序数据库特点,聚焦在物联网、车联网、工业互联网等领域的应用,形成了物联网领域的数据库实施标准。
当然,InfoQ 研究中心也关注到开源不仅发生在数据库领域,因此我们还将继续发布其他领域(云原生、大数据、架构、前端、中间件等)的开源生态图谱系列报告,欢迎大家持续关注。
点击阅读原文,下载报告完整版
微信扫码关注该文公众号作者