Redian新闻
>
DDD死党:查询模型的本质

DDD死党:查询模型的本质

公众号新闻

👉 这是一个或许对你有用的社群

🐱 一对一交流/面试小册/简历优化/求职解惑,欢迎加入芋道快速开发平台知识星球。下面是星球提供的部分资料: 

👉这是一个或许对你有用的开源项目

国产 Star 破 10w+ 的开源项目,前端包括管理后台 + 微信小程序,后端支持单体和微服务架构。

功能涵盖 RBAC 权限、SaaS 多租户、数据权限、商城、支付、工作流、大屏报表、微信公众号等等功能:

  • Boot 地址:https://gitee.com/zhijiantianya/ruoyi-vue-pro
  • Cloud 地址:https://gitee.com/zhijiantianya/yudao-cloud
  • 视频教程:https://doc.iocoder.cn

来源:geekhalo


1. 查询模型的本质

查询模型的本质就是:为不同的应用场景选择最合适的存储引擎,充分发挥各个存储引擎的优势。

在系统中,读接口的数量远超写接口,但我深信:==再简单的写也是复杂,再复杂的读也是简单。==

为什么呢?因为,想做好查询只需为不同的应用场景选择最合适的存储引擎,从而充分发挥底层存储引擎的优势,然后所面对的高性能、高并发等技术问题就迎刃而解了。

如下图所示:

面对一个查询请求,我们需要:

  1. 接受并解析用户请求;
  2. 从各个存储引擎中获取数据;
  3. 对数据进行加工,包括数据聚合、数据关联、数据转换等;
  4. 将最终结果返回用户;

1.1. 常见存储引擎的特征

技术选型唯一原则:==仅仅使用它的成名之作,万万不可被花里胡哨的东西干扰你的判断。==

简单列举下常见的存储引擎:

1.关系数据库。

  • 【特点】提供事务机制对数据强一致性进行保障,其ACID四大特性更是建模利器;
  • 【场景】适用于一致性要求高的金融或类金融场景,比如银行、支付、订单等;

2.Redis。

  • 【特点】基于内存的键值存储引擎,具有高性能和低延迟;支持丰富的数据结构(字符串、哈希、列表、集合、有序集合等)和功能(发布订阅、事务等),提供丰富的持久化选项;
  • 【场景】:缓存、会话存储、计数器、排行榜、分布式锁等对性能和实时性要求较高的场景;

3.Elasticsearch。

  • 【特点】全文搜索和分析引擎,建立在Lucene库之上。擅长水平扩展、近实时搜索、全文搜索和复杂查询等功能;支持分布式架构、自动分片和数据冗余;
  • 【场景】日志分析、实时监控、商业智能、搜索引擎、推荐系统等需要高效的实时全文搜索和分析功能的场景;

4.MongoDB。

  • 【特点】面向文档的NoSQL数据库,以JSON风格的文档格式存储数据;支持动态模式、灵活的索引和复制集、分片等特性,可扩展性好,支持水平扩展;
  • 【场景】大数据量、高写入频率、动态模式和灵活查询的场景,如内容管理系统、用户个性化数据存储、实时分析等;

1.2. 读接口三把利器

对于查询请求,主要有三种模式:

1.Query Object 模式。基于 Query Object 建模,完成对单引擎的快速查询;

  • 通过对 Query Object 对象建模,便可以对查询条件进行灵活管理;
  • 无需写 SQL,只需在 Query Object 上声明好各种过滤条件,便能完成查询。包括单条查询、批量查询、数量查询、分页查询等

2.内存 Join 模式。基于 View Object 建模,完成对结果数据的聚合操作;

  • 通过对 View Object 对象建模,便可以对返回结果进行灵活控制;
  • 无需手写关联代码,只需在 View Object 上声明关联关系,自动完成关联数据的聚合;

3.异构&冗余模式。

  • CQRS 思想的体现,彻底的将写模型和读模型拆分开,从而最大限度的发挥存储引擎优势;
  • 异构意味着冗余,冗余意味着数据不一致,该模式通过准实时巡检、天级对账来保障数据的最终一致性;

三大模式综合使用如下:

  1. 内存 Join 模式,从远程服务、存储引擎中获取数据,完成数据的聚合操作,然后对聚合数据进行转换,返回给用户;
  2. Query Object 模式,大大简化对单引擎的查询,让你从繁重的 SQL(底层API) 中解放出来,大大提升开发效率;
  3. 异构&冗余模式,方便构建多副本异构数据模型,完成最繁琐的数据同步和数据一致性保障;

基于 Spring Boot + MyBatis Plus + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

  • 项目地址:https://github.com/YunaiV/ruoyi-vue-pro
  • 视频教程:https://doc.iocoder.cn/video/

2. Query Object 模式

这是最常见,也是应用最多的模型,主要用于解决单引擎的数据查询。让开发聚焦于查询建模,而不再是繁杂易错的技术细节。

我们以简单的 MySQL 查询为例,假如使用 MyBatis 作为系统的 ORM 框架,其核心流程如下:

  1. 首先,我们会定义一组查询对象;
  2. 当我们接收到参数后,把有效参数填充到 Example 对象;
  3. 然后,将 Example 对象传入 MyBatis API 进行查询;
  4. MyBatis 根据 Mapper 配置,将 Example 对象转换为对应的 SQL 和参数,并提交给 MySQL;
  5. 最终,MySQL 执行 SQL 获取并返回查询结果;

仔细思考下,这里面是不是存在很多“固定逻辑”,而我们每天写的代码是不是有很强的“重复性”?

接下来看下面这张图:

内核和核心流程没有变化,但上层 API 出现巨大变化:

1.首先,引入了 Query Object:

  • 将分散的查询参数封装到一个类中;
  • 在查询对象的属性上多了一组注解,用于声明该属性与数据库查询条件的关系;

2.然后,多了一个核心组件 MyBatisQueryRepository:

  • 从 Query Object 上读取属性和注解信息,并完成对 Example 对象的填充;
  • 使用填充好的 Example 对象调用 MyBatis API,从而完成数据查询;

在该模式下,开发 MyBatis 的单表查询,只有一件事要做:按照业务要求对 Query Object 进行建模。

当然为了方便使用,QueryRepository 提供多种接口:

  1. get:查询单个对象;
  2. listOf:查询多个对象;
  3. countOf:查询数量;
  4. pageOf:分页查询;

如对该部分感兴趣,可研读稍后文章。

该玩法支持复杂查询吗?

首先,不支持。对于复杂查询,只能回归到 MyBatis 底层 API。

【注】不要奢求一个框架或一个方案解决所有问题。使用 20% 的精力来解决 80% 的问题,那开发效率已经得到极大提升。

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

  • 项目地址:https://github.com/YunaiV/yudao-cloud
  • 视频教程:https://doc.iocoder.cn/video/

3. 内存 Join 模式

内存 Join 等同于关系数据库的 Join 语句,只是将 Join 动作从数据层提升到了应用层。

其实我们每天都在写这样的重复代码!!!

假如有一个需求,实现我的订单接口,返回值里面需要包括 用户信息(User)、收获地址信息(Address)、商品信息(Product)等。而这些信息没有在一个数据库,甚至分散在不同的服务,需要调用远程接口才能获取到。由于无法使用数据库的 join 语句,所以就出现了如下接口:

  1. 查询我的订单并将其转换为 OrderDetail 集合:
  1. 获取 User 信息,并填充到 OrderDetail 对象:
  1. 获取 Address 信息,并填充到 OrderDetail 对象:
  1. 获取 Product 信息,并填充到 OrderDetail 对象:
  1. 最后,返回填充好的 OrderDetail 集合;

仔细观察上面的代码,你是找到了“重复逻辑”?

如果,又要开发一个购物车列表呢?购物车列表和我的订单是否存在重复逻辑?

思考完之后,请看 内存 Join 模式:

可以看到:

  1. 大量繁杂冗余代码被简单的 @Join注解 取代
  2. 还可以开启并发模型,使用多线程技术加快接口响应速度

整体流程如下:

我们通过对 View Object 建模便能对返回数据进行控制,从而大大简化对返回结果的开发成本。

如对该部分感兴趣,可研读稍后文章。

4. 异构&冗余模式

异构冗余模式,主要用于多存储引擎的场景,旨在保障多存储引擎间数据的一致性。

比如,在一个复杂的系统中,核心数据存储于 MySQL,使用 Redis 进行缓存加速,使用 ES 完成全文检索。如何设计系统,才能保障 MySQL 中的数据与 Redis、ES 的数据始终保持同步,从而实现最终一致性。

看似很简单,但真正实现起来却到处是坑,在深入思索后得出两个特征:

  1. 存在决策节点并具备强顺序性。按照决策节点给出的变更顺序,依次在异构引擎上进行回放,便能实现两者的最终一致性;
  2. 存在权威的“源信息”,发现不一致时可以使用源头信息对数据进行自动修复;

从而,推导出该场景下的最佳实践:

整体架构分为如下几部分:

  1. 索引 :主要完成数据的构建,从多个系统中拉取数据完成数据的装配,并按所需结构对数据进行转化;
  2. 巡检 :对系统中的数据进行实时巡检或定时对账,发现系统中不一致的数据并完成数据的自动修复。如遇数据无法修复的场景,自动进行报警,人工介入进行处理;
  3. 查询 :充分发挥存储引擎的优势,提供业务查询能力,常与 Query Object 模式 和 内存 Join 模式 结合使用;

通过对最佳实践的封装,可以在同一套组件、同一个数据模型基础上,完成对 索引&更新、巡检&修复 两大流程的融合,大大降低研发工作量。

如对该部分感兴趣,可研读稍后文章。

5. 小结

查询模型的本质就是:为不同的应用场景选择最合适的存储引擎,然后充分发挥各个存储引擎的优势。

基于此提出三个模式:

  1. Query Object 模式 。通过 Query Object 建模,实现对查询条件的灵活管理。无需写 SQL,只需在 Query Object 上声明好各种过滤条件,便能完成常规查询。包括单条查询、批量查询、数量查询、分页查询等;
  2. 内存 Join 模式 。基于 View Object 建模,实现对返回结果的灵活控制。无需手写关联代码,只需在 View Object 上声明关联关系,自动完成关联数据的聚合;
  3. 异构&冗余模式 。CQRS 思想的体现,彻底的将写模型和读模型拆分开,通过准实时巡检、天级对账来保障数据的最终一致性,从而最大限度的发挥存储引擎优势;

欢迎加入我的知识星球,全面提升技术能力。

👉 加入方式,长按”或“扫描”下方二维码噢

星球的内容包括:项目实战、面试招聘、源码解析、学习路线。

文章有帮助的话,在看,转发吧。

谢谢支持哟 (*^__^*)

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
大模型RAG问答技术架构及核心模块回顾:从Embedding、prompt-embedding到Reranker昨天顺手给人治了一个腰病许家印事件的本质是什么?八方面分析美国金融渗透与中国房地产出路!时间管理的本质,是少做事情道德的本质,就是必须作出选择学会做人,才是教育的本质聪明的人VS有智慧的人,两者的本质区别是什么?周彬:教育的本质是育人,而不是教书寂静之声,人生之最一张图教你看清社会的本质和真相(深度)当前世界竞争的本质是什么?尼采:快乐的本质,是正确地做自己余朝辉:产业是本质,科技是引擎,资本是手段,并购要抓住产业的本质《天道》:穷的本质,是没看透这4个底层逻辑汪峰章子怡离婚:婚姻的本质是什么?2024雪球财富日历 | 穿越时间的河流,追寻投资的本质“回归生意的本质”,耶鲁文学系“厂二代”何以实现保温杯的中国品牌梦?普契尼艺术节这才是许家印事件的本质!共享经济的本质,不是共享,而是租赁恒大和许家印问题的本质到底是什么?大厂政治学:考勤的本质是一种管理手段计划经济的本质是崇拜权力的力量,大数据难以弥补其根本缺陷八方面分析美国金融渗透与中国房地产出路!许家印事件的本质是什么?翻开感恩节的历史,思考感恩节的本质!九剑一魂 - 第25回 玉石砥砺 初试锋芒(四)读了人大商学院倒腾大闸蟹,我悟到了生意的本质真护眼还是焦虑税?一文把大路灯的本质讲清楚!5000字透彻分析司法证明的本质《湖天一览楼》1部6章(1.1)高邮光复(上)回归购物的本质——拼多多是如何“拿下”双11的科研上新 | 大模型推进科研边界;大模型的道德价值对齐;优化动态稀疏深度学习模型;十亿规模向量搜索的高效更新AI的大模型时代 ≠ 只有大模型的AI时代许家印事件的本质是什么?美国金融渗透与中国房地产出路!智能的本质就是压缩?马毅团队5年心血提出「白盒」Transformer, 打开LLM黑盒!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。