Redis 集群方案

根据一些测试整理出来的一份方案:

1. Redis 性能

对于redis 的一些简单测试,仅供参考:

测试环境:Redhat6.2 , Xeon E5520(4核)*2/8G,1000M网卡

Redis 版本:2.6.9

客户端机器使用redis-benchmark 简单GET、SET操作:

1. 1单实例测试

1. Value大小:10Byte~1390Byte

处理速度: 7.5 w/s,速度受单线程处理能力限制

2. Value 大小:1400 左右

处理速度突降到5w/s 样子,网卡未能跑满;由于请求包大于MTU造成TCP分包,服务端中断处理请求加倍,造成业务急剧下降。

3. Value大小:>1.5 k

1000M网卡跑满,速度受网卡速度限制



10164146-f544bd50d4934946ba8bb80bdf9a9406

1.2 多实例测试

前提是系统网卡软中断均衡到多CPU核心处理,测试机器网卡开启RSS,有16个队列:

操作:10字节Value SET,服务端开启8个实例,四台客户端服务器每台开启两个redis-benchmark,每个client 速度近4W/s,服务端总处理30w/s左右。

网卡流量:
10164148-5bdac6a03a6c414490810a44bad16e1d

其中8个单数核心CPU全部耗尽,像是超线程没有利用上,测试已经达到很好效果,就没有继续测试下去了。从单实例跑满一个核心7.5w/s,8个实例跑满8个核心,30W/s来看,CPU使用和性能提升不成正比, RSS会造成redis-server线程基本每收到一个请求都切换一次CPU核心,软中断CPU占用太高。这种情况RPS/RFS功能也许就很合适了,RSS只需要映射1~2个核心,然后再讲软中断根据redis-server端口动态转发,保证redis进程都在一个核心上执行,减少进程不必要的切换。

开多实例可以充分利用系统CPU、网卡处理小包能力。具体看业务场景,考虑包平均大小、处理CPU消耗、业务量。如果多实例是为了提高处理能力,需要注意配置网卡软中断均衡,否则处理能力也无法提升。

2. Redis 持久化

测试策略:AOF + 定时rewriteaof

1. 准备数据量:

1亿,Key:12 字节 Value:15字节,存储为string,进程占用内存12G

2. Dump

文件大小2.8G,执行时间:95s,重启加载时间:112s

2. Bgrewriteaof

文件大小5.1G,执行时间:95s,重启加载时间:165s

3.开启AOF后性能影响(每秒fsync一次):

8K/s SET 操作时:cup 从20% 增加到40%

4.修改1Kw数据:

文件大小:5.6G,重启加载时间:194s

5.修改2K数据

文件大小:6.1G,重启加载时间:200s

另:Redis2.4 版本以后对fsync做了不少优化, bgrewriteaof,bgsave 期间对redis对外提供服务完全无任何影响。

3. Redis 主从复制

因为目前版本没有mysql 主从那样的增量备份,对网路稳定性要求很高,如果频繁TCP连接断开会对服务器和网络带来很大负担。

就目前生产环境主从机器部署同一个机架下,几个月都不会又一次连接断开重连的情况的。

4. keepalived 简介

参考官方文档:http://keepalived.org/pdf/sery-lvs-cluster.pdf

Keepalived 是一个用c写的路由选择软件,配合IPVS 负载均衡实用,通过VRRP 协议提供高可用。目前最新版本1.2.7.Keepalived 机器之间实用VRRP路由协议切换VIP,切换速度秒级,且不存在脑裂问题。可以实现

可以实现一主多备,主挂后备自动选举,漂移VIP,切换速度秒级;切换时可通过运行指定脚本更改业务服务状态。

如两台主机A、B,可以实现如下切换:

1.A 、B 依次启动,A作为主、B为从

2 .主A 挂掉,B接管业务,作为主

3.A 起来,作为从SLAVEOF B

4.B 挂掉,A 切回主

将一台全部作为主,即可实现主从,可做读写分离;也可以通过多个VIP,在一台机器上多个实例中一半主、一半从,实现互备份,两机同时负责部分业务,一台宕机后业务都集中在一台上

安装配置都比较简单:

  需要依赖包:openssl-devel(ubuntu 中为 libssl-dev),popt-devel (ubuntu中为libpopt-dev)。

  配置文件默认路径:/etc/keepalived/keepalived.conf 也可以手动指定路径,不过要注意的是手动指定需要使用绝对路径。主要要确保配置文件的正确性,keepalived 不会检查配置是否符合规则。

  使用keepalived -D 运行,即可启动3个守护进程:一个父进程,一个check健康检查,一个Vrrp,-D将日志写入/var/log/message,可以通过日志查看切换状况。

注意问题:

1. VRRP 协议是组播协议,需要保证主、备、VIP 都在同一个VLAN下

2. 不同的VIP 需要与不同的VRID 对应,一个VLAN 中VRID 不能和其他组冲突

3. 在keepalived 有两个角色:Master(一个)、Backup(多个),如果设置一个为Master,但Master挂了后再起来,必然再次业务又一次切换,这对于有状态服务是不可接受的。解决方案就是两台机器都设置为Backup,而且优先级高的Backup设置为nopreemt 不抢占。

5. 通过keepalived实现的高可用方案

10164150-983fdb63f1f34b81947f384e4d819d35
切换流程:

1. 当Master挂了后,VIP漂移到Slave;Slave 上keepalived 通知redis 执行:slaveof no one ,开始提供业务

2. 当Master起来后,VIP 地址不变,Master的keepalived 通知redis 执行slaveof slave IP host ,开始作为从同步数据

3. 依次类推

主从同时Down机情况:

1. 非计划性,不做考虑,一般也不会存在这种问题

2. 、计划性重启,重启之前通过运维手段SAVE DUMP 主库数据;需要注意顺序:

1. 关闭其中一台机器上所有redis,是得master全部切到另外一台机器(多实例部署,单机上既有主又有从的情况);并关闭机器

2. 依次dump主上redis服务

3. 关闭主

4. 启动主,并等待数据load完毕

5. 启动从

删除DUMP 文件(避免重启加载慢)

6. 使用Twemproxy 实现集群方案

一个由twitter开源的c版本proxy,同时支持memcached和redis,目前最新版本为:0.2.4,持续开发中;https://github.com/twitter/twemproxy .twitter用它主要减少前端与缓存服务间网络连接数。

特点:快、轻量级、减少后端Cache Server连接数、易配置、支持ketama、modula、random、常用hash 分片算法。
10164153-10d5562feeb5478cb0dd3df29293937e

这里使用keepalived实现高可用主备方案,解决proxy单点问题;

优点:

1. 对于客户端而言,redis集群是透明的,客户端简单,遍于动态扩容

2. Proxy为单点、处理一致性hash时,集群节点可用性检测不存在脑裂问题

3. 高性能,CPU密集型,而redis节点集群多CPU资源冗余,可部署在redis节点集群上,不需要额外设备

7 . 一致性hash

使用zookeeper 实现一致性hash。

redis服务启动时,将自己的路由信息通过临时节点方式写入zk,客户端通过zk client读取可用的路由信息。
10171026-9c459434bb9e45f59d63d934110fd4b5

服务端
使用python 脚本写的守护进程:https://github.com/LittlePeng/redis-manager

脚本部署在redis-server本机,定时ping redis-server

节点失效的情况:

1.服务器与ZK服务器失去连接 Session Expired ,环境网络波动造成,需要根据网络情况设置适当zookeeper的Timeout时间,避免此情况发生

2. 服务器宕机,Zookeeper server 发现zkclient ping超时,就会通知节点下线

3. redis-server 挂了,redis-manager ping 超时主动断开与zookeeper server的连接

客户端
需要zkclient监控 节点变化,及时更新路由策略

下面是C# 版本一致性hash算法:

class KetamaNodeLocator
{
    private Dictionary<long, RedisCluster> ketamaNodes;
    private HashAlgorithm hashAlg;
    private int numReps = 160;
    private long[] keys;
 
    public KetamaNodeLocator(List<RedisCluster> nodes)
    {
        ketamaNodes = new Dictionary<long, RedisCluster>();
 
        //对所有节点,生成nCopies个虚拟结点
              for (int j = 0; j < nodes.Count; j++) {
                  RedisCluster node = nodes[j];
                  int numReps = node.Weight;
 
                  //每四个虚拟结点为一组
                  for (int i = 0; i < numReps / 4; i++) {
                      byte[] digest = ComputeMd5(
                          String.Format("{0}_{1}_{2}", node.RoleName, node.RouteValue, i));
 
                      /** Md5是一个16字节长度的数组,将16字节的数组每四个字节一组,
                       * 分别对应一个虚拟结点,这就是为什么上面把虚拟结点四个划分一组的原因*/
                      for (int h = 0; h < 4; h++) {
 
                          long rv = ((long)(digest[3 + h * 4] & 0xFF) << 24)
                                     | ((long)(digest[2 + h * 4] & 0xFF) << 16)
                                     | ((long)(digest[1 + h * 4] & 0xFF) << 8)
                                     | ((long)digest[0 + h * 4] & 0xFF);
 
                          rv = rv & 0xffffffffL; /* Truncate to 32-bits */
                          ketamaNodes[rv] = node;
                      }
                  }
              }
 
              keys = ketamaNodes.Keys.OrderBy(p => p).ToArray();
          }
          public RedisCluster GetWorkerNode(string k)
          {
              byte[] digest = ComputeMd5(k);
              return GetNodeInner(Hash(digest, 0));
          }
 
          RedisCluster GetNodeInner(long hash)
          {
              if (ketamaNodes.Count == 0)
                  return null;
              long key = hash;
              int near = 0;
              int index = Array.BinarySearch(keys, hash);
              if (index < 0) {
                  near = (~index);
                  if (near == keys.Length)
                      near = 0;
              }
              else {
                  near = index;
              }
 
              return ketamaNodes[keys[near]];
          }
 
          public static long Hash(byte[] digest, int nTime)
          {
              long rv = ((long)(digest[3 + nTime * 4] & 0xFF) << 24)
                      | ((long)(digest[2 + nTime * 4] & 0xFF) << 16)
                      | ((long)(digest[1 + nTime * 4] & 0xFF) << 8)
                      | ((long)digest[0 + nTime * 4] & 0xFF);
 
              return rv & 0xffffffffL; /* Truncate to 32-bits */
          }
 
          public static byte[] ComputeMd5(string k)
          {
              MD5 md5 = new MD5CryptoServiceProvider();
 
              byte[] keyBytes = md5.ComputeHash(Encoding.UTF8.GetBytes(k));
              md5.Clear();
              return keyBytes;
          }
      }

8 . 监控工具

历史redis运行查询:CPU、内存、命中率、请求量、主从切换等

实时监控曲线

短信报警

使用基于开源Redis Live 修改工具,便于批量实例监控,基础功能都已实现,细节也将逐步完善。

源码地址如下:

https://github.com/LittlePeng/redis-monitor

还没有评论,快来抢沙发!

发表评论

  • 😉
  • 😐
  • 😡
  • 😈
  • 🙂
  • 😯
  • 🙁
  • 🙄
  • 😛
  • 😳
  • 😮
  • emoji-mrgree
  • 😆
  • 💡
  • 😀
  • 👿
  • 😥
  • 😎
  • ➡
  • 😕
  • ❓
  • ❗
  • 69 queries in 0.395 seconds