Redian新闻
>
2 小时的 SQL 操作,1 分钟就搞定?!

2 小时的 SQL 操作,1 分钟就搞定?!

公众号新闻

点击上方“芋道源码”,选择“设为星标

管她前浪,还是后浪?

能浪的浪,才是好浪!

每天 10:33 更新文章,每天掉亿点点头发...

源码精品专栏

 
来源:yes的练级攻略

今天来讲讲关于大表删除 的问题。

比如,你现在需要删除一张一共有 5 亿数据的表里面的 2021 年数据,假设这张表叫 yes。

我相信你脑子在 1s 内肯定会蹦出这条 SQL :

delete from yes where create_date > "2020-12-31" and create_date < "2022-01-01";

如果直接执行这条 SQL 会发生什么问题呢?

长事务

我们需要关注到一个前提:这张表有 5 亿的数据,所以它是一张超大表,因此这个 where 条件可能涉及非常多的数据,所以我们可以从离线数仓或者备库查下数据量,然后我们发现这条 SQL 会删除 3 亿左右的数据。

那么一次性 delete 完的方案是不行的,因为这会涉及到长事务的问题

长事务涉及到加锁,只会在事务执行完毕后才会释放锁,由于长事务锁了很多数据,如果期间有频繁的 DML 想要操作这些数据,那么就会造成阻塞。

连接都阻塞住了,业务线程自然就阻塞了,也就是说你的服务线程都在等待数据库的响应,然后可能还会影响到别的服务,可能产生雪崩,于是就 GG 了。

长事务可能会造成主从延迟,你想想主库执行了好久,才执行完给从库,从库又要重放好久,期间可能有很长一段时间数据是不同步的。

还有一种情况,业务都有个特殊停机窗口,你觉得你可以为所欲为,然后开始执行长事务了,然后执行了 5 小时之后,不知道啥情况抛错了,事务回滚了,于是浪费了 5 个小时,还得重新开始。

综上,我们需要避免长事务的发生。

那面对可能发生长事务的 SQL 我们怎么拆 呢?

基于 Spring Boot + MyBatis Plus + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

  • 项目地址:https://github.com/YunaiV/ruoyi-vue-pro
  • 视频教程:https://doc.iocoder.cn/video/

拆 SQL

我们就以上面这条 SQL 为例:

delete from yes where create_date > "2020-12-31" and create_date < "2022-01-01";

看到这条 SQL,如果要拆分,想必很多小伙伴会觉得很简单,按日期拆不就完事了?

delete from yes where create_date > "2020-12-31" and create_date < "2021-02-01";
delete from yes where create_date >= "2021-02-01" and create_date < "2021-03-01";

......

这当然可以,恭喜你,你已经拆分成功了,没错就这么简单。

但是,如果 create_date 没有索引怎么办?

没索引的话,上面这就全表扫描了啊?

影响不大,没有索引我们就给他创造索引条件,这个条件就是主键。

我们直接一个 select min(id)... 和 select max(id).... 得到这张表的主键最小值和最大值,假设答案是 233333333 和 666666666。

然后我们就可以开始操作了:

delete from yes where (id >= 233333333 and id < 233433333and create_date > "2020-12-31" and create_date < "2022-01-01";
delete from yes where (id >= 233433333 and id <233533333and create_date > "2020-12-31" and create_date < "2022-01-01";

......

delete from yes where (id >= 666566666 and id <=666666666and create_date > "2020-12-31" and create_date < "2022-01-01";

当然你也可以再精确些,通过日期筛选来得到 maxId,这影响不大(不满足条件的 SQL 执行很快,不会耗费很多时间)。

这样一来 SQL 就满足了分批的操作,且用得上索引。

如果哪条语句执行出错,只会回滚小部分数据,我们重新排查下就好了,影响不大。

而且拆分 SQL 之后还可以并行提高执行效率

当然,并行可能有锁竞争的情况,导致个别语句等待超时。不过影响不大,只要机器状态好,执行得快,因为锁竞争导致的等待并不一定会超时,如果个别 SQL 超时的话,重新执行就好了。

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

  • 项目地址:https://github.com/YunaiV/yudao-cloud
  • 视频教程:https://doc.iocoder.cn/video/

有时候要转换思路

关于大表删除有时候要转换思路,把删除转成插入

假设还是有一张 5 亿的数据表,此时你需要删除里面 4.8 亿的数据,那这时候就不要想着删除了,要想着插入。

道理很简单,删除 4.8 亿的数据,不如把要的 2000W 插入到新表中,我们后面业务直接用新表就好了。

这两个数据量对比,时间效率差异不言而喻了吧?

具体操作也简单:

  1. 创建一张新表,名为 yes_temp;
  2. 将 yes 表的 2000W 数据 select into 到 yes_temp 中;
  3. 将 yes 表 rename 成 yes_233;
  4. 将 yes_temp 表 rename 成 yes。

狸猫换太子,大功告成啦!

之前有个记录表我们就是这样操作的,就 select into 近一个月的数据到新表中,以前老数据就不管了,然后 rename 一下,执行得非常快。

本来预估 2 小时的 SQL 操作,1 分钟就搞定了。

这种类似的操作是有工具的,比如 pt-online-schema-change 等,不过我没用过,有兴趣的小伙伴可以自己去看看,道理是一样的,多了几个触发器,这里不多赘述了。

最后

咱们开发还是得多学一些数据库的操作和原理,因为好多数据库的操作都需要亲力亲为,小公司没 DBA 的话就不说了,大公司的话咱也不知道 DBA 到底会关心到哪个程度,还是得靠自己靠谱。



欢迎加入我的知识星球,一起探讨架构,交流源码。加入方式,长按下方二维码噢

已在知识星球更新源码解析如下:

最近更新《芋道 SpringBoot 2.X 入门》系列,已经 101 余篇,覆盖了 MyBatis、Redis、MongoDB、ES、分库分表、读写分离、SpringMVC、Webflux、权限、WebSocket、Dubbo、RabbitMQ、RocketMQ、Kafka、性能测试等等内容。

提供近 3W 行代码的 SpringBoot 示例,以及超 4W 行代码的电商微服务项目。

获取方式:点“在看”,关注公众号并回复 666 领取,更多内容陆续奉上。

文章有帮助的话,在看,转发吧。

谢谢支持哟 (*^__^*)

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
能和面包打擂台,这做法真的开挂了!热乎松软香喷喷,一口蒸锅就搞定游荡四年之后,还是回到了文学城澳洲$2亿Medicare退款无人领!快看看你有份吗?很多人因一个细节错过领钱,几分钟就能搞定非肿瘤必备,高通量首选,5分+纯生信1个数据库就搞定!一天就搞定BCG的ESG证书,我在LinkedIn收到20+内推10分钟就赚到房租,19岁网红拍片呛"为什么要辛苦赚钱"被战翻IC毕业,我靠SQL在英国年入6w英镑王室超爱的巴洛克珍珠,我只花129就搞定了!30岁后的小肚子,这么瘦最管用!每天几分钟就能搞定凌晨芝加哥!平均每8.5分钟就有1人被持枪抢劫 1小时内高达7人遇到犯罪案亲戚来拜年,全被它折服了!一煮就搞定,小脸喝得红润透亮!软到双手捏不住,清甜软糯会上瘾!无需烤箱,这年货小点心3步就搞定隐语开源首个工业级多方安全数据分析系统SCQL:像写SQL一样「易用」隐私计算节省100小时的方法!5分钟检索1分钟下载,查文献再也不用求人!(建议收藏)MySQL 批量操作,一次插入多少行数据效率最高?多大毕业,我靠SQL在加拿大年入10w加币了解那些“奇葩”SQL写法,快速写出高效率SQL早餐最馋这几碗面!比油泼面更过瘾,10分钟就上桌,汤汁不剩~不给娃买贵的就有罪?明明几十块就搞定冬季护肤,好用才是王道!GraphPad Prism 9 入门,3分钟上手,5分钟出图,分分钟搞定CNS级美图!謝盛友傳奇早上给娃一碗它,胜过10杯牛奶!5分钟就能搞定,简单营养还健康手工制作,无添加,十几分钟就能给娃一顿营养早餐,一周不重样【懒人Brunch食谱】用马克杯3分钟就能搞定!超简单!SQL能完成哪方面的计算?一文详解关系代数和SQL语法德国建筑大师冯·格康逝世网站都变成灰色,几行代码就搞定了!一段心理创伤,需要多久能恢复自住房更要报!多伦多房屋空置报告开始填表:3分钟就搞定人人都夸的硬核年菜,有个蒸锅就搞定!一口软糯一口鲜,整桌就它先光盘@La人,快薅国税局羊毛?补贴ERC退款来啦,一文就搞定!名画欣赏:从“拾穗”到“罂粟花”MySQL客户端的进阶操作又到湿疹高发季!我只用这一招,就搞定红疹、瘙痒、水肿!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。