Redis 进阶
Redis 高级特性与性能调优
数据持久化
RDB(Redis DataBase)
采用 RDB 持久方式,Redis 会定期保存数据快照至一个 RBD 文件中,并在启动时自动加载 RDB 文件,恢复之前保存的数据。
可以在配置文件中配置 Redis 进行快照保存的时机:
save [seconds] [changes]
意为在 [seconds] 秒内如果发生了 [changes] 次数据修改,则进行一次 RDB 快照保存,例如:
save 60 100
会让 Redis 每 60 秒检查一次数据变更情况,如果发生了 100 次或以上的数据变更,则进行 RDB 快照保存。可以配置多条 Save 指令,让 Redis 执行多级的快照保存策略。 Redis 默认开启 RDB 快照,默认的 RDB 策略如下:
save 900 1
save 300 10
save 60 10000
也可以通过BGSAVE
命令手工触发 RDB 快照保存。
AOF(Append Only File)
采用 AOF 持久方式时,Redis 会把每一个写请求都记录在一个日志文件里。在 Redis 重启时,会把 AOF 文件中记录的所有写操作顺序执行一遍,确保数据恢复到最新。
AOF 默认是关闭的,如要开启,进行如下配置:
appendonly yes
AOF 提供了三种 Fsync 配置,always/everysec/no
,通过配置项 [appendfsync]
指定:
- appendfsync no:不进行 Fsync,将 Flush 文件的时机交给 OS 决定,速度最快。
- appendfsync always:每写入一条日志就进行一次 Fsync 操作,数据安全性最高,但速度最慢。
- appendfsync everysec:折中的做法,交由后台线程每秒 Fsync 一次。
随着 AOF 不断地记录写操作日志,必定会出现一些无用的日志,例如某个时间点执行了命令 SET key1 “abc”
,在之后某个时间点又执行了 SET key1 “bcd”
,那么第一条命令很显然是没有用的。
大量的无用日志会让 AOF 文件过大,也会让数据恢复的时间过长。所以 Redis 提供了AOF Rewrite
功能,可以重写 AOF 文件,只保留能够把数据恢复到最新状态的最小写操作集。
AOF Rewrite
可以通过 BGREWRITEAOF
命令触发,也可以配置 Redis 定期自动进行:
auto-aof-rewrite-percentage 100
auto-aof-rewrite-min-size 64mb
上面两行配置的含义是,Redis 在每次 AOF Rewrite 时,会记录完成 Rewrite 后的 AOF 日志大小,当 AOF 日志大小在该基础上增长了 100% 后,自动进行 AOF Rewrite。 同时如果增长的大小没有达到 64MB,则不会进行 Rewrite。
内存管理与数据淘汰机制
最大内存设置
默认情况下,在 32 位 OS 中,Redis 最大使用 3GB 的内存,在 64 位 OS 中则没有限制。
在使用 Redis 时,应该对数据占用的最大空间有一个基本准确的预估,并为 Redis 设定最大使用的内存。
否则在 64 位 OS 中 Redis 会无限制地占用内存(当物理内存被占满后会使用 Swap 空间),容易引发各种各样的问题。
通过如下配置控制 Redis 使用的最大内存:
maxmemory 100mb
在内存占用达到了 maxmemory 后,再向 Redis 写入数据时,Redis 会:
- 根据配置的数据淘汰策略尝试淘汰数据,释放空间。
- 如果没有数据可以淘汰,或者没有配置数据淘汰策略,那么 Redis 会对所有写请求返回错误,但读请求仍然可以正常执行。
在为 Redis 设置 maxmemory 时,⚠️需要注意:如果采用了 Redis 的主从同步,主节点向从节点同步数据时,会占用掉一部分内存空间;如果 maxmemory 过于接近主机的可用内存,导致数据同步时内存不足。 所以设置的 maxmemory 不要过于接近主机可用的内存,留出一部分预留用作主从同步。
数据淘汰机制
Redis 提供了 5 种数据淘汰策略:
- volatile-lru:使用 LRU 算法进行数据淘汰(淘汰上次使用时间最早的,且使用次数最少的 Key,只淘汰设定了有效期的 Key。
- allkeys-lru:使用 LRU 算法进行数据淘汰,所有的 Key 都可以被淘汰。
- volatile-random:随机淘汰数据,只淘汰设定了有效期的 Key。
- allkeys-random:随机淘汰数据,所有的 Key 都可以被淘汰。
- volatile-ttl:淘汰剩余有效期最短的 Key。
最好为 Redis 指定一种有效的数据淘汰策略以配合 maxmemory 设置,避免在内存使用满后发生写入失败的情况。
一般来说,推荐使用的策略是 volatile-lru
,并辨识 Redis 中保存的数据的重要性。
对于那些重要的,绝对不能丢弃的数据(如配置类数据等),应不设置有效期,这样 Redis 就永远不会淘汰这些数据。
对于那些相对不是那么重要的,并且能够热加载的数据(比如缓存最近登录的用户信息,当在 Redis 中找不到时,程序会去 DB 中读取),可以设置上有效期,这样在内存不够时 Redis 就会淘汰这部分数据。
配置方法:
maxmemory-policy volatile-lru
# 默认是noeviction,即不进行数据淘汰
Redis 性能调优
尽管 Redis 是一个非常快速的内存数据存储媒介,也并不代表 Redis 不会产生性能问题。 Redis 采用单线程模型(Redis 6.0之前),所有的命令都是由一个线程串行执行的,所以当某个命令执行耗时较长时,会拖慢其后的所有命令,这使得 Redis 对每个任务的执行效率更加敏感。 针对 Redis 的性能优化,主要从下面几个层面入手:
- 最初的也是最重要的,确保没有让 Redis 执行耗时长的命令。
- 使用 Pipelining 将连续执行的命令组合执行。
- 操作系统的 Transparent huge pages 功能必须关闭。
echo never > /sys/kernel/mm/transparent_hugepage/enabled
- 如果在虚拟机中运行 Redis,可能天然就有虚拟机环境带来的固有延迟。可以通过 ./redis-cli –intrinsic-latency 100 命令查看固有延迟。
- 同时如果对 Redis 的性能有较高要求的话,应尽可能在物理机上直接部署 Redis。
- 检查数据持久化策略。
- 考虑引入读写分离机制。
读写分离
对于缓存而言,读的需求量是远大于写的需求量的,而读写分离的机制就是在主机上执行写操作,然后异步地将数据复制到从机上,而从机只负责读操作,假设一台从机具有2万QPS,当业务场景需要10万的QPS时,只需要横向扩展5台redis从机即可(可支持水平扩展的读高并发架构).
Redis 的主从复制能力可以实现一主多从的多节点架构,在这一架构下,主节点接收所有写请求,并将数据同步给多个从节点。在这一基础上,我们可以让从节点提供对实时性要求不高的读请求服务,以减小主节点的压力。 尤其是针对一些使用了长耗时命令的统计类任务,完全可以指定在一个或多个从节点上执行,避免这些长耗时命令影响其他请求的响应。
主从复制
Redis 支持一主多从的主从复制架构。一个 Master 实例负责处理所有的写请求,Master 将写操作同步至所有 Slave。 借助 Redis 的主从复制,可以实现读写分离和高可用:
- 实时性要求不是特别高的读请求,可以在 Slave 上完成,提升效率。特别是一些周期性执行的统计任务,这些任务可能需要执行一些长耗时的 Redis 命令,可以专门规划出 1 个或几个 Slave 用于服务这些统计任务。
- 借助 Redis Sentinel 可以实现高可用,当 Master Crash 后,Redis Sentinel 能够自动将一个 Slave 晋升为 Master,继续提供服务。
启用主从复制非常简单,只需要配置多个 Redis 实例,在作为 Slave 的 Redis 实例中配置:
slaveof 192.168.1.1 6379
# 指定Master的IP和端口
当 Slave 启动后,会从 Master 进行一次冷启动数据同步,由 Master 触发 BGSAVE 生成 RDB 文件推送给 Slave 进行导入。
导入完成后 Master 再将增量数据通过 Redis Protocol 同步给 Slave。之后主从之间的数据便一直以 Redis Protocol 进行同步。
使用 Sentinel 做自动 Failover:Redis 的主从复制功能本身只是做数据同步,并不提供监控和自动 Failover 能力,要通过主从复制功能来实现 Redis 的高可用,还需要引入一个组件:Redis Sentinel
。
Redis Sentinel 是 Redis 官方开发的监控组件,可以监控 Redis 实例的状态,通过 Master 节点自动发现 Slave 节点,并在监测到 Master 节点失效时选举出一个新的 Master,并向所有 Redis 实例推送新的主从配置。
Redis Sentinel 需要至少部署 3 个实例才能形成选举关系。关键配置:
sentinel monitor mymaster 127.0.0.1 6379 2 # Master实例的IP、端口,以及选举需要的赞成票数
sentinel down-after-milliseconds mymaster 60000 # 多长时间没有响应视为Master失效
sentinel failover-timeout mymaster 180000 # 两次failover尝试间的间隔时长
sentinel parallel-syncs mymaster 1 # 如果有多个Slave,可以通过此配置指定同时从新Master进行数据同步的Slave数,避免所有Slave同时进行数据同步导致查询服务也不可用
另外需要注意的是,Redis Sentinel 实现的自动 Failover 不是在同一个 IP 和端口上完成的。 也就是说自动 Failover 产生的新 Master 提供服务的 IP 和端口与之前的 Master 是不一样的。 所以要实现 HA,还要求客户端必须支持 Sentinel,能够与 Sentinel 交互获得新 Master 的信息才行。
集群分片
为何要做集群分片?原因如下:
- Redis 中存储的数据量大,一台主机的物理内存已经无法容纳。
- Redis 的写请求并发量大,一个 Redis 实例以无法承载。
当上述两个问题出现时,就必须要对 Redis 进行分片了。Redis 的分片方案有很多种,例如很多 Redis 的客户端都自行实现了分片功能,也有向 Twemproxy 这样的以代理方式实现的 Redis 分片方案。
Redis Cluster 的能力:
- 能够自动将数据分散在多个节点上。
- 当访问的 Key 不在当前分片上时,能够自动将请求转发至正确的分片。
- 当集群中部分节点失效时仍能提供服务。
其中第三点是基于主从复制来实现的,Redis Cluster 的每个数据分片都采用了主从复制的结构,原理和前文所述的主从复制完全一致。 唯一的区别是省去了 Redis Sentinel 这一额外的组件,由 Redis Cluster 负责进行一个分片内部的节点监控和自动 Failover。 Redis Cluster 分片原理:Redis Cluster 中共有 16384 个 hash slot,Redis 会计算每个 Key 的 CRC16,将结果与 16384 取模,来决定该 Key 存储在哪一个 hash slot 中。 同时需要指定 Redis Cluster 中每个数据分片负责的 Slot 数。Slot 的分配在任何时间点都可以进行重新分配。
主从复制 VS 集群分片
在设计软件架构时,要如何在主从复制和集群分片两种部署方案中取舍呢?从各个方面看,Redis Cluster 都是优于主从复制的方案:
- Redis Cluster 能够解决单节点上数据量过大的问题。
- Redis Cluster 能够解决单节点访问压力过大的问题。
- Redis Cluster 包含了主从复制的能力。
那是不是代表 Redis Cluster 永远是优于主从复制的选择呢?并不是。软件架构永远不是越复杂越好,复杂的架构在带来显著好处的同时,一定也会带来相应的弊端。
参考链接
- redis 中文教程: https://www.redis.com.cn/redis-keys
- redis Documetation: https://redis.io/documentation
- redis 高级特性与性能调优: https://zhuanlan.zhihu.com/p/61053939