当前位置：首页 > 问答 > 正文

Redis 实例内存怎么监控效率，使用情况怎么看和分析

符海莹
问答
2026-01-23 18:07:20
2

要监控Redis实例的内存使用效率并进行有效分析,首先需要了解从哪里获取信息以及如何解读这些信息，核心在于使用Redis内置的命令和结合外部的监控工具。

使用Redis内置命令查看内存基本情况

最直接的方式是使用Redis提供的INFO命令，并指定memory部分，在Redis命令行中输入INFO memory，会返回大量与内存相关的键值对，根据Redis官方文档对INFO命令的说明，其中几个关键指标需要重点关注：

used_memory： 这是Redis分配器（通常是jemalloc）实际分配的内存总量，包含了Redis所有数据和内部开销的大小，这个值是你最需要关心的“当前使用了多少内存”。
used_memory_rss： 这个值是从操作系统角度看到的Redis进程占用的物理内存大小（Resident Set Size），它通常会比used_memory大，因为其中包含了内存碎片等，如果这个值远大于used_memory（例如超过1.5倍），说明内存碎片比较严重。
used_memory_peak： 表示Redis运行以来used_memory的峰值，这个值可以帮助你了解实例曾经遇到过的最大内存负载，对于容量规划很有意义。
mem_fragmentation_ratio： 这是内存碎片率，计算公式是used_memory_rss / used_memory，根据Redis Labs的知识库文章，这个比值是衡量内存效率的关键指标。
- 比值在1到1.5之间通常被认为是健康的，说明碎片率在可接受范围。
- 比值大于1.5表明碎片化程度较高，可能会影响性能，并导致不必要的内存浪费。
- 比值小于1则比较罕见,这可能表示Redis的部分内存被操作系统交换到了硬盘上（swap），这会严重拖慢性能。
maxmemory： 这是你在配置文件中为Redis实例设置的最大内存限制，当used_memory接近这个值时，Redis会根据配置的maxmemory-policy（内存淘汰策略）开始淘汰数据或拒绝写入请求。
used_memory_dataset： 这个指标表示实际存储的数据所占用的内存大小，大致等于used_memory减去Redis自身内部开销的大小，它可以帮你了解真正用于存储数据的比例。

除了INFO memory，另一个非常有用的命令是MEMORY STATS，这个命令会提供一个更详细的内存使用情况报告，它详细列出了用于不同目的（如主字典、过期字典、客户端缓冲区等）的内存消耗，对于深入分析内存用在了哪里非常有帮助。

分析内存使用详情和查找大Key

知道了总内存使用情况后,下一步是分析具体是哪些数据占用了大部分内存，Redis中的Key大小并不均匀，往往是少数“大Key”消耗了绝大部分内存。

使用MEMORY USAGE命令： 这个命令可以估算一个特定Key及其值所占用的内存字节数，用法是MEMORY USAGE your_key_name，你可以通过这个命令来验证你怀疑的大Key。
使用--bigkeys参数扫描： 这是查找大Key最高效的方法，通过命令行工具redis-cli执行redis-cli -h your_host -p your_port --bigkeys，这个命令会以非阻塞的方式扫描整个数据库，并统计出每种数据类型中最大的Key，根据Redis官方文档，这是识别大Key的首选方法，但需要注意，在生产环境运行可能会对性能有轻微影响，建议在低峰期进行。
使用第三方工具分析RDB文件： 更深入的分析方法是定期将生产环境的RDB备份文件下载到开发机，然后使用像redis-rdb-tools这样的第三方Python工具进行分析，这个工具可以生成一个内存报告，清晰地列出每个Key的大小，并可以按大小排序，让你对内存分布有最精确的了解。

结合外部监控系统进行持续监控

命令行工具适合临时排查,但生产环境需要持续性的监控和告警，这时需要将Redis的指标集成到现有的监控系统中。

Prometheus + Grafana： 这是目前最流行的组合，可以通过Redis Exporter来抓取INFO命令暴露出的所有指标，然后由Prometheus进行存储，最后在Grafana中创建丰富的监控仪表盘，你可以将关键指标如used_memory、mem_fragmentation_ratio、connected_clients等可视化，并设置告警规则，例如当内存使用率超过90%或碎片率超过1.8时触发告警。
云服务商的控制台： 如果你使用的是阿里云、腾讯云等云服务商的Redis服务，那么其控制台通常会提供开箱即用的监控仪表盘和告警功能，这些面板已经集成了上述关键指标，使用起来非常方便。

常见内存问题分析思路

内存使用率持续增长直至触顶：
- 分析： 首先检查业务量是否确实在增长，如果不是，很可能存在内存泄漏，重点排查：
  - 客户端输出缓冲区： 是否有慢查询导致输出缓冲区堆积？是否有订阅了频道但消费很慢的客户端？使用CLIENT LIST命令查看obl（输出缓冲区长度）和oll（输出列表长度）是否异常。
  - 是否未设置过期时间： 检查是否有大量应该过期淘汰的数据没有设置TTL。
- 行动： 优化代码，避免慢查询；为数据设置合理的过期时间；调整maxmemory-policy为合适的策略（如allkeys-lru）。
内存碎片率过高：
- 分析： 频繁的修改和删除操作会导致内存碎片，如果服务对性能要求高且碎片率持续过高，需要考虑重启。
- 行动： Redis 4.0及以上版本支持了MEMORY PURGE命令（依赖特定分配器）来主动清理碎片，最彻底的方法是启用activedefrag配置项，让Redis在后台自动进行内存碎片整理，如果条件允许，在业务低峰期重启实例也能立即解决碎片问题。
发现大Key：
- 分析： 大Key（如一个Hash有百万个字段）不仅占用内存多，在序列化/反序列化、迁移、删除时都会引起操作延迟，甚至阻塞服务。
- 行动： 将大Key进行拆分，一个大的Hash可以按字段哈希成多个小的Hash Key，或者，如果存储的是序列化对象，检查是否可以将对象字段拆分成多个独立的Key。