Redis
cpu使用率过高
一、报警内容
[REDIS cpu使用率报警]
二、可能影响
- 整体的吞吐量和应用的响应速度,极端情况下甚至会导致应用不可用
三、问题定位
- 发出这种报警的时候,表明 Redis 的 cpu 占用率很高。一般可能是因为业务方访问 Redis 的量猛增,或者有许多慢查询的操作,导致耗时很久。
四、处理方式
- 如果为业务增长导致,则建议提单申请扩容,升级需要在维护期间进行
- 如果同时也有慢查询报警,则是慢查询导致,根据实际情况进行优化
主从切换告警
一、报警内容
[REDIS 主从切换告警]
二、可能影响
- 服务异常
三、问题定位
- 宿主机发生了死机现象,导致 Redis 实例发生主从切换。
- master 由于一些原因发生阻塞,例如:有些命令或者脚本耗时很久,导致 Redis 阻塞。
- 网络的抖动,导致机器间的通讯发生短暂的中断,而误判为 master 失去响应,从而发生主从切换。
四、处理方式
- 提单处理,根据实际情况定位和解决问题
主从切换告警
一、报警内容
[REDIS 连接数报警]
二、可能影响
- redis连接超时甚至无法连接
三、问题定位
- 表明这个实例中的某几台机器出现大量连接,可能是由于程序并发量过高,或者连接方式不当的问题
四、处理方式
- 如果是业务代码变更导致,请根据实际情况优化代码