Redian新闻
>
Redis删除数据后,为什么内存占用率还是很高?

Redis删除数据后,为什么内存占用率还是很高?

公众号新闻

作为面试经历都很丰富的兄弟们,应该或多或少被问到或者自己亲身经历过这个问题,问题如下:

Redis做了数据删除操作,为什么使用top命令时,Redis还是占了很多内存?

没做相关功课的人觉得这个问题有问题,删了数据还说占着内存,面试官不是在误导我吗,事实并非如此!

这里先说答案 📝📝

🌐 实际上,这是因为,当数据删除后,Redis 释放的内存空间会由内存分配器管理,并不会立即返回给操作系统。所以,操作系统仍然会记录着给 Redis 分配了大量内存。

而 used_memory_rss 记录着在操作系统角度,Redis进程占用的物理总内存

这样看来文章好像讲完了,开头就知道答案,当然不是,内容多着呢~

文章将从下面这些点分析扩展你对于Redis内存方面的知识点,以及内存碎片和如何清理内存碎片。

毕竟面试官问你一个问题,你选择只回答一句和面试官掰扯掰扯两种方式,那么第二种情况更会让他觉得你厉害爆了,懂得真多!🤣🤣🤣

Redis内存消耗组成

Redis内存消耗主要在于其主进程消耗和子进程消耗。而主进程消耗又主要包括自身内存、对象内存、缓冲区内存、内存碎片四个方面:

自身进程占用内存

Redis进程自身所占用的内存,这部分内存通常很小,一个空的Redis进程所消耗的内存几乎可以忽略不计

数据对象内存

对象占用的内存是Redis中占用内存最大的,这里存储这我们的键值对,我们知道不同的数据类型占用的内存空间大小也不同,特别是那种大key占用内存的情况就更惊人了。

缓冲区

Redis主要有三大缓冲区:客户端缓冲区、AOF缓冲区、复制缓存区

📔 客户端缓冲区: 为了解决客户端和服务端请求和处理速度不匹配问题(即CPU 与 I/O 设备速度不匹配的矛盾),分为输入和输出缓冲区。

输入缓冲区会先把客户端发送过来的命令暂存起来,Redis 主线程再从输入缓冲区中读取命令,进行处理。当在处理完数据后,会把结果写入到输出缓冲区,再通过输出缓冲区返回给客户端。

📘 AOF缓冲区: 在进行AOF持久化时所用到的缓冲区,AOF缓冲区消耗的内存取决于AOF重写时间和写入命令量, 分为AOF缓冲区和AOF重写缓冲区

📙 复制缓冲区:是在集群环境中为了保证主从节点数据同步的所设置的,由于主从节点间的数据复制包括全量复制和增量复制两种。因此复制缓冲区也分为复制缓冲区和复制积压缓冲区两种,分别用于全量和增量同步

内存碎片

内存碎片主要是有两个原因:操作系统的内存分配机制、Redis存储特性,这两个原因我们在文章中会具体提到。

子进程消耗

子进程消耗是指在RDB、AOF重写时fork()子进程的内存消耗

🔥🔥 有人说这不是用到了写时复制技术吗?

📢 虽然子进程可以不用完全复制父进程的物理内存,但是仍然需要复制其内存页表,在此期间如果有写入操作则需要复制出一份副本出来,因此同样会消耗一部分内存,消耗的内存两取决于RDB和AOF重写期间的写入命令数量。

查看内存指标

查看当前Redis相关内存信息用 info memory 命令,如果是集群使用 cluster info命令

127.0.0.1:6379> info memory
used_memory:856472 // Redis 存储数据占用的内存量used_memory_human:836.40K // 人类可读形式返回内存总量used_memory_rss:1282048 // 操作系统角度,进程占用的物理总内存used_memory_rss_human:1.22M // used_memory_rss 可读性模式展示used_memory_peak:857448 // 内存使用的最大值,表示 used_memory 的峰值used_memory_peak_human:837.35K // 以可读的格式返回 used_memory_peak的值used_memory_lua:37888 // Lua 引擎所消耗的内存大小。used_memory_lua_human:37.00Kmaxmemory:2147483648 // 能使用的最大内存值,字节为单位。maxmemory_human:2.00G // 可读形式maxmemory_policy:noeviction // 内存淘汰策略
// used_memory_rss / used_memory 的比值,代表内存碎片率mem_fragmentation_ratio:2.79

used_memory_rss:操作系统分配给 Redis 进程的内存空间(包含内存碎片占用的空间),此数据结果约等于top、ps命令看到的数据结果,是从操作系统层看到的数据

maxmemory:Redis 最大可用内存,0表示不限制,我们一般会设置这个值,避免所有内存超过物理内存

内存为何没释放

Redis 释放的内存空间会由内存分配器管理,并不会立即返回给操作系统,是因为采用了一种称为“惰性删除”的机制,即在数据被删除之后,并不会立即释放内存空间,而是等到有新数据需要使用该空间时才会释放。

这种方式的好处是可以减少内存分配和释放的开销,提高 Redis 的性能。

但是Redis释放内存空间可能不是连续的,可能导致空间闲置(也就是出现内存碎片),而内存碎片过大会导致明明有空间可用,但是却无法存储数据!

ok!我们继续看看什么是内存碎片

内存碎片

前面我们已经了解了Redis占用内存的组成以及如何查看内存占用信息,接下来看什么是内存碎片和导致出现内存碎片的原因。

Redis使用多种内存分配策略,例如 jemalloc 和 libc,这些分配器无法做到按需分配,通常会按照固定大小进行分配。例如,如果Redis申请6字节的内存,操作系统会分配8字节的内存给Redis使用,剩下的2个字节空间无法被使用就是内存碎片。

但这种分配方式也有优势,可以减少向操作系统申请空间分配。

导致Redis产生内存碎片主要由以下两点:

  • 内存分配机制导致

  • 数据修改引发空间扩容和释放

内存分配机制导致

操作系统的架构和 Redis jemalloc 分配策略无法做到按需分配,而是应用程序申请内存大小必须是一块连续的内存地址空间。

这种连续是按固定大小来分配的,比如:8字节、16 字节、32 字节、64 字节 ... 这种方式会在程序申请内存接近某个值的时候,jemalloc就会给它分配响应大小的内存空间。

上图中:

第一次存储数据是需要6字节,而Redis内存分配策略给你分配了8字节,空出2个字节的空间。

第二次存储数据是需要4个字节,但是空出的2个字节无法保存4字节数据,所以会再次向系统申请8字节内存空间,空出了4字节,两次存储数据就多出来6个字节的内存碎片。

这也就是内存分配机制导致的形成碎片的风险和原因。

数据修改引发空间扩容和释放

这个原因应该更好理解吧,若修改数据时占用的空间有变化,此时就需要扩容或者缩容;而删除数据也会将内存释放出来,形成碎片。

如下图:

  • 各数据占用内存字节空间分别是A:2、B:1、C:3、D:3

  • 此时D释放了一个字节空间

  • A修改了数据,增加了一个字节。为保证A的内存空间连续性,B的数据拷贝到了第二阶段D释放出来的那个字节位置

  • C修改后删除了2个字节空间

可以看出经过一系列对数据的修改,C和D之间有2字段内存空间,此时多出来2字节空间就是内存碎片。

处理内存碎片

如何在进行处理内存碎片,那么以什么为参考呢?

前面说的 info memory命令,如果指标值 mem_fragmentation_ratio (内存碎片率)的值,在 1 < 碎片率 < 1.5,可以认为是合理的,而大于 1.5 说明碎片已经超过 50%,我们需要采取一些手段解决碎片率过大的问题。

有下面三种方式可处理 🚩🚩🚩:

重启Redis实例

重启Redis属于直接当时粗暴的方式,在重启之前要考虑两点:

  • 若Redis的数据没有持久化,数据会丢失

  • 即使做了持久化,重启需要通过AOF或RDB恢复数据,恢复时间取决于日志的大小,如果恢复时间长,这个阶段实例就不能提供服务了

这种方式还是要慎重!

memory purge手动碎片整理

手动整理内存碎片,会阻塞主进程,生产环境慎用。

memory purge 和 activedefrag回收的并不是同一块区域的内存,它简单粗暴的尝试清除脏页以便内存分配器回收。可以根据实际情况和activedefrag配合使用,memory purge在极端情况下效果较好,activedefrag则更彻底。

开启activedefrag自动碎片整理

在Redis 4.0 版本后新增配置项activedefrag,activedefrag默认关闭,计划清理碎片时需手动开启,命令如下:

127.0.0.1:6379> config set activedefrag yes
自动整理内存碎片,其原理是通过scan迭代整个Redis数据,通过一系列的内存复制、转移操作完成内存碎片整理,由于此操作使用的是主线程,故会影响Redis对其他请求的响应。

如上图碎片整理过程:

  1. 清理前,C和D之间多了2字节的内存碎片

  2. 清理过程:将B和D的数据分别拷贝到C和D之间的闲置空间,这样2个字节的闲置空间就形成了连续空间。当新应用要申请小于3个字节的空间时,这个闲置空间就能利用起来了

清理的条件

active-defrag-ignore-bytes 200mb:内存碎片占用的内存达到 200MB,开始清理;

active-defrag-threshold-lower 20:内存碎片的空间占比超过系统分配给 Redis 空间的 20% ,开始清理


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
数据如何删除?《加州删除法案》介绍自研规模效应,毛利首次转正,为什么说零跑三季报“含金量”很高?ICLR 2024录用率31%!北大张铭、田渊栋、ResNeXt一作谢赛宁等大佬晒出成绩单为什么你的现任和前任总是很像COVID疫苗第四针面试官:ThreadLocal 为什么会内存泄漏吗?是怎么产生的?面试必问!2024年卫生资格考试通过率还会这么低吗?Redis实战 | 使用Redis 的有序集合(Sorted Set)实现排行榜功能,和Spring Boot集成突破600元,“没有任何优惠活动”!业内:大概率还要涨!可以“无脑入”吗?专家提醒…年龄不保密比新冠致死率还高! 致命禽流感疫情正席卷加国! BC省成重灾区!官宣放弃 Electron 两年后,微软让 Teams “重生”:内存降 50%、磁盘空间占用少 70%公司新来一个同事:为什么 HashMap 不能一边遍历一边删除?一下子把我问懵了!韩国人的“内卷”诅咒:一天只睡四小时,卷上天了,却还是很穷山东:你有葱高?东北:你有肠高?Deadly School Stampede Renews Calls For Scheduling Reform【最新】加拿大央行不加息,为什么各大银行的房贷利率还在上调?!市委书记掌掴秘书长有什么内幕?Windows非分页缓冲池内存使用率较高的问题部分旧版Chase Freedom用户被强制“暖心升级”成Chase Freedom Unlimited苹果副总裁回应 “黄金内存”:「统一内存架构」的8GB近似于其它系统的16GB千难万险留学梦 (4)待续我为什么拒绝删除Blue Note事件视频?法拉盛上演侠盗与飞车 警察还是很卖力的!99岁卡特总统的长寿秘密入职就奖励$3000!但还是很缺人?!奥克兰老板透露背后原因…比藤校录取率还低!中国孩子如何冲击顶尖美高骨折价继续!Freedom美加20GB数据月费$29!年计划15GB数据$119!山西原省长于幼军:我打烂了很多人的饭碗,但山西人对我还是很好How a Red-Haired Chatbot Became China’s Favorite English Tutor出云的秋有没有什么人能告诉我一下,澳洲华人现在是不是失业率很高?比签证通过率还高!85%的走线客,被放进美国...专家警告加国利率还要涨!加国药房这些常见药短缺华人邻居因为建围栏闹上法庭!夫妻俩上交了这些证据后,法庭宣判...
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。