redis 简易监控的几种方法

时间:2022-06-26 07:21:18

简介

针对Redis 实现性能监控的几种方法

一、使用info命令

命令说明

127.0.0.1:6380> info
# Server
redis_version:3.2.11
redis_git_sha1:00000000
redis_git_dirty:0
redis_build_id:41a708998db14d05
redis_mode:standalone
os:Linux 3.0.76-0.11-default x86_64
arch_bits:64
multiplexing_api:epoll
gcc_version:4.3.4
process_id:16942
run_id:e3996796aba6cff723f1e58feb42fa9ea9515b01
tcp_port:6380
uptime_in_seconds:4215152
uptime_in_days:48
hz:10
lru_clock:3786096
executable:/home/iotweb/local/redis/./bin/redis-server
config_file:/home/iotweb/local/redis/redis.conf # Clients
connected_clients:2
client_longest_output_list:0
client_biggest_input_buf:0
blocked_clients:0 # Memory
used_memory:6392944
used_memory_human:6.10M
used_memory_rss:13623296
used_memory_rss_human:12.99M
used_memory_peak:12523592
used_memory_peak_human:11.94M
total_system_memory:33673551872
total_system_memory_human:31.36G
used_memory_lua:37888
used_memory_lua_human:37.00K
maxmemory:0
maxmemory_human:0B
maxmemory_policy:noeviction
mem_fragmentation_ratio:2.13
mem_allocator:jemalloc-4.0.3 # Persistence
loading:0
rdb_changes_since_last_save:0
rdb_bgsave_in_progress:0
rdb_last_save_time:1510133670
rdb_last_bgsave_status:ok
rdb_last_bgsave_time_sec:0
rdb_current_bgsave_time_sec:-1
aof_enabled:0
aof_rewrite_in_progress:0
aof_rewrite_scheduled:0
aof_last_rewrite_time_sec:-1
aof_current_rewrite_time_sec:-1
aof_last_bgrewrite_status:ok
aof_last_write_status:ok # Stats
total_connections_received:2013
total_commands_processed:3129128
instantaneous_ops_per_sec:0
total_net_input_bytes:138114786
total_net_output_bytes:3167119897
instantaneous_input_kbps:0.00
instantaneous_output_kbps:0.00
rejected_connections:0
sync_full:0
sync_partial_ok:0
sync_partial_err:0
expired_keys:0
evicted_keys:0
keyspace_hits:1
keyspace_misses:1
pubsub_channels:0
pubsub_patterns:0
latest_fork_usec:1107
migrate_cached_sockets:0 # Replication
role:master
connected_slaves:0
master_repl_offset:0
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0 # CPU
used_cpu_sys:3631.63
used_cpu_user:2210.61
used_cpu_sys_children:0.20
used_cpu_user_children:1.47 # Cluster
cluster_enabled:0 # Keyspace
db0:keys=53500,expires=0,avg_ttl=0

指标说明

  • Server 指通用的服务器信息,包括版本号、监听端口、进程ID等
  • Clients 指客户端信息,包括接入数量、阻塞数量等
  • Memory 内存信息,包括虚拟内存、物理内存、碎片比例(rss/used)等
  • Persistence 持久化信息,包括RDB和AOF的相关信息
  • Stats 统计信息,包括历史命令数、键数量、网络流量等
  • Replication 主从复制信息,包括slave及backlog相关信息
  • CPU CPU使用相关信息
  • Cluster 集群信息
  • Keyspace 逻辑空间信息,包括数据库键数、超时及TTL信息

参考文档

二、使用redis-stat

项目地址

https://github.com/junegunn/redis-stat

项目说明

redis-stat 是基于Ruby实现的一个简单易用的 Redis监控工具

redis-stat 的实现原理基于INFO(见上)命令,相比MONITOR命令来说其对Redis不会产生任何性能影响。

此外 redis-stat项目也提供了Console及Web界面两种展现形式。

如何搭建

redis-stat 的使用需要依赖ruby,但Jruby为我们提供了使用Java的打开方式。

  1. 下载Jar包,点击这里
  2. 执行启动脚本
java -jar redis-stat-0.4.14.jar 127.0.0.1:6380 3 --server=63800 > monitor.log &
  1. 控制台输出
Puma 2.3.2 starting...
* Min threads: 0, max threads: 16
* Environment: development
* Listening on tcp://0.0.0.0:63800
== Sinatra/1.3.6 has taken the stage on 63800 for production with backup from Puma
┌────────────────────────┬────────────────┐
│ │ 127.0.0.1:6380 │
├────────────────────────┼────────────────┤
│ redis_version │ 3.2.11 │
│ redis_mode │ standalone │
│ process_id │ 16942 │
│ uptime_in_seconds │ 4216406 │
│ uptime_in_days │ 48 │
│ role │ master │
│ connected_slaves │ 0 │
│ aof_enabled │ 0 │
│ rdb_bgsave_in_progress │ 0 │
│ rdb_last_save_time │ 1510133670 │
└────────────────────────┴────────────────┘ ┌────────┬──┬──┬──┬───┬──────┬──────┬─────┬─────┬─────┬─────┬──────┬─────┬─────┬─────┐
time us sy cl bcl mem rss keys cmd/s exp/s evt/s hit%/s hit/s mis/s aofcs
├────────┼──┼──┼──┼───┼──────┼──────┼─────┼─────┼─────┼─────┼──────┼─────┼─────┼─────┤
10:26:30 - - 1 0 6.08MB 13.0MB 53.5k - - - - - - 0B
10:26:33 0 0 1 0 6.08MB 13.0MB 53.5k 0.33 0 0 - 0 0 0B
10:26:36 0 0 1 0 6.08MB 13.0MB 53.5k 0.33 0 0 - 0 0 0B

监控效果

使用 http://127.0.0.1:63800/ 地址可以直接访问Web界面,见下图

redis 简易监控的几种方法

指标说明

简写 指标 说明
us used_cpu_user 用户空间占用CPU百分比
sy used_cpu_sys 内核空间占用CPU百分比
cl connected_clients 连接客户端数量
bcl blocked_clients 阻塞客户端数量(如BLPOP)
mem used_memory 使用总内存
rss used_memory_rss 使用物理内存
keys dbx.keys key的总数量
cmd/s command/s 每秒执行命令数
exp/s expired_keys/s 每秒过期key数量
evt/s evicted_keys/s 每秒淘汰key数量
hit%/s keyspace_hitratio/s 每秒命中百分比
hit/s keyspace_hits/s 每秒命中数量
mis/s keyspace_miss/s 每秒丢失数量
aofcs aof_current_size AOF日志当前大小

类似redis-stat 还有redis-live等若干开源项目

三、自研工具

工具简介

redis-stat提供了一种简易的方式实现对Redis实例的监控,但多数场景下可能需要进行定制,比如鉴权方式、统计指标、告警等等

为实现更灵活的控制,可利用类似的方式对INFO信息进行解析,以实现自有Redis实例的统一监控。

redis 简易监控的几种方法

代码样例

  • 调用info 命令
    public String getInfo() {
Jedis jedis = get();
try {
String infoContent = jedis.info();
return infoContent;
} finally {
if (jedis != null) {
jedisPool.returnResource(jedis);
}
}
}
  • 解析结果
		for (String line : lines) {
if (line.isEmpty()) {
continue;
} if (line.startsWith("#")) {
part = line.replace("#", "").trim();
continue;
} int index = line.indexOf(':');
if (index >= 0) {
infoMap.put(part + "." + line.substring(0, index), line.substring(index + 1));
}
}
  • 数据转换处理
           Map<String, String> infoMap = parseInfo(infoContent);

            stat.setUsed_cpu_sys(getIntValue(infoMap, "CPU.used_cpu_sys"));
stat.setUsed_cpu_user(getIntValue(infoMap, "CPU.used_cpu_user")); stat.setBlocked_clients(getIntValue(infoMap, "Clients.blocked_clients"));
stat.setConnected_clients(getIntValue(infoMap, "Clients.connected_clients"));
stat.setUsed_memory(getIntValue(infoMap, "Memory.used_memory"));
stat.setUsed_memory_rss(getIntValue(infoMap, "Memory.used_memory_rss")); //
int cmd = getIntValue(infoMap, "Stats.total_commands_processed");
int exp = getIntValue(infoMap, "Stats.expired_keys");
int evt = getIntValue(infoMap, "Stats.evicted_keys"); int hit = getIntValue(infoMap, "Stats.keyspace_hits");
int mis = getIntValue(infoMap, "Stats.keyspace_misses"); long lastTs = stat.getTimestamp();
long thisTs = System.currentTimeMillis();

实现效果

实例名称 用户CPU 系统CPU 总连接数 阻塞连接 使用内存 物理内存 键数量 CMD速率 EXP速率 EVT速率 HIT速率 MIS速率 时间
appdb0/100.112.56.105:26529 2 2 3 0 1.0M 2.0M 12 0 0 0 0 0 2018/2/5 18:27
appdb1/100.112.56.105:26520 2 3 4 0 1.0M 2.0M 8 16 0 0 4 0 2018/2/5 18:27
appdb2/100.112.56.105:26523 3 5 3 0 1.0M 2.0M 19 52 0 0 5 0 2018/2/5 18:27