Redian新闻
>
干货:分布式数据库技术路线及方案分类

干货:分布式数据库技术路线及方案分类

公众号新闻


内容参考自《2022年中国数据库产品策略解析报告》和《2021年中国分布式数据库市场报告》,旨在分析中国分布式数据库市场的发展现状、产品特点及技术发展趋势,并判断中国分布式数据库市场竞争态势,反映该细分市场领导者品牌的差异化竞争优势。

数据库的重要性:数据库作为大多数信息系统的基础设施,向下发挥硬件算力,向上使能上层应用,是IT行业中大厦的地基、飞船的引擎、更是开发者的必备武器。数据库的速度、易用性、稳定性、扩展性、成本都对企业的基础业务与增长弹性至关重要。

假如数据库从未诞生,程序员需要面对海量的数据关系与不可靠的计算机系统。而在数据库的基础上,程序员不需要重新设计复杂的系统流程保证数据处理的事务性,转而只需要增删改查CRUD的简单操作,大大降低了数据存储与处理的复杂性。


数据库的定义与分类:是按照特定数据结构组织,存储和管理数据的基础软件。分布式数据库是用计算机网络将物理上分散的多个数据库单元连接起来组成的一个逻辑上统一的数据库。本篇报告从分布式架构的视角出发,多方位关注数据库行业的前沿动向。

分布式数据库概念及技术发展沿革:数据库已经经历了半个世纪的发展,经历了学术界驱动、商业化落地、论文工业实现、企业应用需求驱动等技术发展阶段。

从一开始的层面模型,网状模型,关系模型,到对象模型,对象关系模型,半结构化等,数据模型一直是数据库的核心和理论基础,而扎实的理论支撑和更佳的逻辑独立性仍然将是未来数据库的根本。


在商业化落地后,Oracle带着MySQL、微软的SQL Server等领衔关系型数据库占领市场多年。从SQL、NoSQL到NewSQL,甚至是HTAP,都在迭代中推动着业务能力的发展。

当前,云+分布式已经成为了企业极限需求的唯一解决方案,并造就了当前数据库行业的爆发期。在当前与持续的行业周期中,先进的产品与技术都需要围绕市场,才能成为最重要的竞争优势。

分布式数据库行业支撑体系:中国分布式数据库的发展取得了人口红利。而技术创新需要先进的学术研究体系,产研结合需要紧密的产业交流,行业渗透则需要紧跟时代需求的人才培训体系。


中国数据库产品图谱:中国数据库厂商分为传统数据库厂商、新兴数据库厂商、云厂商、ICT跨界厂商四类,各家提供不同的集中式数据库与分布式数据库产品中国数据库厂商及代表数据库产品传统数据库厂商达梦数据库。


分布式数据库技术路线分类:目前数据库分布式技术路线选择上,都是以解决数据容量扩展问题为首要目标,主流方案为分库分表中间件、原生分布式等,不同技术路线及产品各有优劣。

分库分表+中间件方案∶下层的单机数据库提供存储和执行能力,在多个单机数据库上封装一层中间层补充分布式能力,以统一的数据分片规则管理分布在不同数据库节点的数据,并提供SQL解析,请求转发和结果合并的能力。


共享存储分布式数据库:计算节点独立并且共享一个不带计算功能的存储集群(Shared-storage),数据存储的底层是可动态扩容的分布式高性能存储,以存算分离架构,计算层和存储层都可以动态扩缩容,并且这些分布式数据库都会对网络以及存储层的优化来保证高可用和高性能。


去中心化的分布式数据库:每个节点有独立的计算和存储功能并且节点之间不共享数据,(Shared-nothing),为了平滑的扩缩容也采用了存算分离的架构,分布式集群的每个节点都是独立节点,通过multi-paxos或者multi-raft等共识算法来保证多副本的可用性。


异构多模态化数据库数据库:的异构多模态化已经成为主流,但值得注意的是多模的发展离不开单模数据库技术的成熟化,将单模能力下沉给垂直引擎成为多模的内置能力,在不同模型的处理效率上有所侧重倾斜。


多模数据库发展现况:在DB-Engines上,可以见Oracle、MySQL、SQL Server、PostgreSQL本身都是关系型基础上支持多模的,MongoDB、Redis等也在向其它类型兼容。

多模已经成为主流,但值得注意的是多模的发展离不开单模数据库技术的成熟化,将单模能力下沉给垂直引擎成为多模的内置能力,在不同模型的处理效率上有所侧重倾斜。

多模数据库的发展:从用户的使用层面出发,在一个数据库中同时支持多模型,以更简单的数据库架构处理更多的不要求高性能的异构数据,大大提升了使用易用性、运维效率、存储成本。对不同数据类型采用统一的SQL访问接口,极大优化了数据库体验。

随着应用数据需求的多样化,单模数据库的技术成熟化,用户经常需要面对异构数据的分析。每一个应用都需要开发数据中间层来对接多种数据库,去处理模型转换、数据分发、数据同步、查询合并等一系列问题。

当大数据量在关系型,其它数据类型的分析频次不高时,一个能够面向上层的业务逻辑提供统一存储、统一访问并保证数据正确的异构多模数据库系统成为了共性需求。另外,HTAP也正是这个需求的延伸概念。

HTAP混合负载:随着业务系统接入的数据源及业务复杂性的不断增加,混合负载的需求越发普遍,数据库技术正在导向多源异构、高实时并发、多SQL标准接口的方向。


业务混合负载需求成为常态:无论是传统业务应用需求依托IOE架构通过分库分表的方式扩容,还是大数据业务应用需求依托Hadoop平台架构,两者都积聚了众多问题且难以解决,运维和使用
受限已不能满足时代需要。

随着业务系统接入的数据源及业务复杂性的不断增加,数据库技术正在导向多源异构、高实时并发、多SQL标准接口的方向。混合负载的需求越发普遍,用户希望通过统一的访问接口(如SQL),按不同的方式(如离线、在线)使用数据。


HTAP混合事务和分析处理:HTAP描述的是消除OLTP和OLAP之间的间隔,使一个分布式数据库系统既可以应用于事务型数据库场景,又可以应用于分析型数据库场景,从而满足实时业务决策的需求。

HTAP能让数据产生后马上就可以进入分析场景,但它面临最大的问题是如何把OLTP和OLAP两类互斥的工作负载更好放在一个系统上运行,并且实现资源干扰小、数据可见度高、延时短。


目前HTAP有两种方案∶分离架构和统一架构,分离架构是目前的主流方案。趋势中,云原生架构环境与HTAP系统的融合将衍生新的HTAP产品方案和技术特征。

从云托管到云原生的数据库发展趋势:数据库上云,起初借助基础设施即服务(laaS),直接将传统数据库托管在云上,关系型数据库服务(RDS)就是这样的产品。而RDS这类方案,在迁移上云的过程需要对性能和事务作出妥协,存在资源利用率低、维护成本高、可用性低等问题。于是,相比于迁移数据库上云,在云上建设数据库服务,设计出以基础云先行,从应用、中间件、数据库服务全线适应云特点的云原生数据库尤为重要。


数据库的未来发展趋势总结:分布式数据库技术已经步入商业应用的成熟期,但分布式仅是数据库众多维度中的一环,那么从长远的目光中,再将视角放诸整个数据库技术的大厦中,数据库的未来将如何发展。


开源情况:开源理念的发展经历了以Linux为代表的自由开发者运动,以Hadoop为代表的技术栈驱动社区,数据库开源生态步入了极致场景驱动社区协作阶段。


业务与技术相互更加紧密,迭代速度更快、增长率更好、更代表未来的方案将是竞争力王牌。场景驱动开发“执行于一款流行的开源软件之上,产品“触感”源于对普遍需求的准确把握,高流行度代表着高用户基数与多场景触达,经过一轮又一轮的用户反馈、bug修改、迭代建议后实现正向的迭代循环,覆盖更广的应用场景。

转自:全栈云技术架构

转载申明:转载本号文章请注明作者来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。

推荐阅读
更多架构相关技术知识总结请参考“架构师全店铺技术资料打包”相关电子书(37本技术资料打包汇总详情可通过“阅读原文”获取)。
全店内容持续更新,现下单“架构师技术全店资料打包汇总(全)”,后续可享全店内容更新“免费”赠阅,价格仅收198元(原总价350元)。


温馨提示:
扫描二维码关注公众号,点击小程序链接获取架构师技术联盟书店电子书资料详情

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
数据库“焕然新生”:架构视角下,云原生数据库的创新实践 | Q推荐[电脑] 重金属工业风-aboStudio ContainerL 装机方案分享分布式 ID 生成方案总结整理边缘计算现状及三大技术路线(2022)开源如何构建分布式信任 | Linux 中国Go基础会了怎么进阶?可以动手搞下这个分布式实战 | 极客时间多款数据库入选 Gartner 全球数据库魔力象限,腾讯云是怎么做到的?| Q推荐一封石涛写给八大的信,如何通过书迹鉴别真伪分布式追踪与监控:Skywalking介绍茄汁虾仁MLPerf排名榜刷新:相同GPU配置训练BERT,飞桨用分布式技术拿下世界第一在美国215.佛州参观、访友、送戒指特斯拉人形机器人真机发布!能跳舞能干活,完整技术路线公布最小可行架构注意事项:必须考虑分布式处理和数据的位置研发分布式储能与智能电网系统,「云能魔方」完成数千万元天使轮融资丨36氪首发单体架构服务转型至分布式的踩坑经历分布式存储:三种主流形态及主要场景10月28日9:00,H. Vincent Poor教授分享当无线网络边缘“遇上”分布式机器学习畅游法国(12)-玫瑰的海岸惨案!老板要求单体架构转型分布式踩坑!一文看懂分布式链路监控系统香港中文大学(深圳)数据科学学院招聘博士后 - 分布式优化和机器学习方向支撑千亿级日交易额,平安科技分布式数据库架构设计ChatGPT的各项超能力从哪儿来?万字拆解追溯技术路线图来了!争相上市、抢夺本土市场,未来三五年数据库将迎来大洗牌 | 解读数据库的2022比SQL快几倍到几百倍,这个国产数据库技术真的强!Sharding JDBC 实战:分布式事务处理数据烟囱亟需打破,云原生融合数据库雪中送炭|解读云原生数据库的 2022大规模GNN如何学习?北邮最新《分布式图神经网络训练》综述,35页pdf阐述分布式GNN训练算法和系统CPU技术及产业:分类与产业篇阿里云已将 Serverless 数据库大规模落地,这是否代表着数据库的新风向?食杂店的生存之道国产数据库市场横空杀出个巨头?亚信 AntDB数据库凭什么MySQL 分布式事务的“路”与“坑”聊一聊分布式锁的设计模型
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。