注意使用 BTREE 复合索引各字段的 ASC/DESC 以优化 order by 查询效率

时间:2022-06-07 17:58:02
tbl_direct_pos_201506 表有 190 万数据。DDL:
CREATE TABLE `tbl_direct_pos_201506` (
`acq_ins_code` char(13) NOT NULL DEFAULT '' COMMENT '机构代码',
`trace_num` char(6) NOT NULL DEFAULT '' COMMENT '跟踪号',
`trans_datetime` char(10) NOT NULL DEFAULT '' COMMENT '交易时间',
`process_flag` char(1) DEFAULT NULL COMMENT '处理标识',
`rev_flag` char(1) DEFAULT NULL COMMENT '接收标识',
`before_trans_code` char(3) DEFAULT NULL COMMENT '交易类型',
`trans_amt` decimal(15,3) DEFAULT NULL COMMENT '交易金额',
`acct_num` char(21) DEFAULT NULL COMMENT '卡号',
`mer_type` char(4) DEFAULT NULL COMMENT '商户类型',
`recv_ins_code` char(13) DEFAULT NULL COMMENT '发卡行代码',
`retrivl_ref_num` char(12) DEFAULT NULL COMMENT '检索參考号',
`resp_auth_code` char(6) DEFAULT NULL COMMENT '授权码',
`resp_code` char(2) DEFAULT NULL COMMENT '应答码',
`term_id` char(8) DEFAULT NULL COMMENT '终端代码',
`mer_code` char(15) DEFAULT NULL COMMENT '商户代码',
`mer_addr_name` char(40) DEFAULT NULL COMMENT '商户名称和地址,前 25 字节是名称,后面是地址',
`self_define` varchar(300) DEFAULT NULL COMMENT '第 259 字节是卡片类型',
`sys_date` char(8) NOT NULL DEFAULT '' COMMENT '交易日期',
`sa_sav2` varchar(300) DEFAULT NULL COMMENT '第 243 字节是 DCC 标识',
`rec_create_time` datetime DEFAULT NULL COMMENT '联机入库时间',
`rec_update_time` datetime DEFAULT NULL COMMENT '最后改动时间',
PRIMARY KEY (`sys_date`,`trans_datetime`,`acq_ins_code`,`trace_num`),
KEY `idx_direct_pos_create_time` (`rec_create_time`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8 COMMENT='交易月表模板';

关于该表的一个慢查询日志例如以下:
# Time: 150701 15:45:28
# User@Host: test[test] @ localhost [127.0.0.1]  Id:     1
# Query_time: 2.478195  Lock_time: 0.010007 Rows_sent: 20  Rows_examined: 450612
SET timestamp=1435736728;
select substr(t.acq_ins_code, 3) merAcqInsCode, t.mer_code, t.term_id, substr(t.mer_addr_name, 1, 12) merName,
tt.trans_desc, t.rev_flag, t.trans_amt, concat(substr(t.sys_date, 1, 4), t.trans_datetime) transTime,t.before_trans_code,
t.acct_num, t.retrivl_ref_num,  t.resp_code, t.resp_auth_code,  r.recv_ins_name,t.acq_ins_code,t.trace_num,t.trans_datetime,
case substr(t.sa_sav2,259,1)  when 1 then '借记卡' when 2 then '贷记卡'
when 3 then '准贷记卡' when 4 then '私有预付卡' else '' end  cardType,
case 
when locate('VIS',t.sa_sav2) > 0 then 'VISA' 
when locate('JCB',t.sa_sav2) > 0 then 'JCB' 
when locate('DNC',t.sa_sav2) > 0 then '大莱卡' 
when locate('CUP',t.sa_sav2) > 0 then '银联境内卡' 
when locate('UPI',t.sa_sav2) > 0 then '银联*卡'
else '' end cardBrand 
from tbl_direct_pos_201506 t
left join trans_recv_ins r on r.recv_ins_code = t.recv_ins_code
left join tbl_trans_type tt on tt.trans_code = t.before_trans_code
where t.sys_date between '20150622' and '20150628' 
order by
t.sys_date desc, t.trans_datetime desc, t.acq_ins_code, t.trace_num 
limit 0, 20;
日志中能够看出该 sql 的运行时间是 2.478 s。

我们来查看一下该 sql 的运行计划:

id select_type table type possible_keys key key_len ref rows Extra
1 SIMPLE t range PRIMARY PRIMARY 24   299392 Using index condition; Using filesort
1 SIMPLE r eq_ref PRIMARY PRIMARY 41 msp.t.recv_ins_code 1 Using where
1 SIMPLE tt eq_ref PRIMARY PRIMARY 14 msp.t.before_trans_code 1 Using where

运行计划分析:
Using filesort。是的,看到它。说明我们的查询须要优化了:文件排序是通过对应的排序算法,将取得的数据在内存中进行排序。

MyISAM 存储引擎的主键索引和非主键索引区别非常小,仅仅只是是主键索引的索引键是一个唯一且非空的键而已。

MyISAM 的索引默觉得 B-TREE。也就是说,主键在这里相当于一个普通的 B-TREE。
该 sql 一个 where 字段,四个 order by 字段。都在主键里边呀,并且 order by 的顺序全然符合最左前缀原则,为什么还要 filesort?
MySql 索引创建手冊里如是说:
索引列的定义能够尾随 ASC 或者 DESC。这些keyword同意为未来扩展用于指定升序或降序索引值存储。这个语法会被解析但却被忽略。索引列总是以升序排列。

——也就是说你写了不会报错,但写了白写。

这样看来,我们的主键没起排序作用。原因就在于我们的主键是各主键字段 asc 存储。 order by 里 desc 和 asc(默认是 asc) 混用。为了验证这个说法。我们把该 order by 换为和主键一致的 asc:

select substr(t.acq_ins_code, 3) merAcqInsCode, t.mer_code, t.term_id, substr(t.mer_addr_name, 1, 12) merName,
tt.trans_desc, t.rev_flag, t.trans_amt, concat(substr(t.sys_date, 1, 4), t.trans_datetime) transTime,t.before_trans_code,
t.acct_num, t.retrivl_ref_num, t.resp_code, t.resp_auth_code, r.recv_ins_name,t.acq_ins_code,t.trace_num,t.trans_datetime,
case substr(t.sa_sav2,259,1) when 1 then '借记卡' when 2 then '贷记卡'
when 3 then '准贷记卡' when 4 then '私有预付卡' else '' end cardType,
case
when locate('VIS',t.sa_sav2) > 0 then 'VISA'
when locate('JCB',t.sa_sav2) > 0 then 'JCB'
when locate('DNC',t.sa_sav2) > 0 then '大莱卡'
when locate('CUP',t.sa_sav2) > 0 then '银联境内卡'
when locate('UPI',t.sa_sav2) > 0 then '银联*卡'
else '' end cardBrand
from tbl_direct_pos_201506 t
left join trans_recv_ins r on r.recv_ins_code = t.recv_ins_code
left join tbl_trans_type tt on tt.trans_code = t.before_trans_code
where t.sys_date between '20150622' and '20150628'
order by
t.sys_date, t.trans_datetime, t.acq_ins_code, t.trace_num
limit 0, 20;

运行时间:0.023 s。

结果差强人意。查看其运行计划:

id select_type table type possible_keys key key_len ref rows Extra
1 SIMPLE t range PRIMARY PRIMARY 24   299392 Using index condition
1 SIMPLE r eq_ref PRIMARY PRIMARY 41 msp.t.recv_ins_code 1 Using where
1 SIMPLE tt eq_ref PRIMARY PRIMARY 14 msp.t.before_trans_code 1 Using where

果然,我们利用到了主键索引,Using filesort 没有了。
既然找的了问题的症兆所在,接下来的事情似乎仅仅是走流程了。
问了下业务,分页结果里 sys_date 和 trans_datetime 两个字段必须降序排列。其余两个字段倒不是非常在意。
既然我们无法更改索引每一列的降序、升序(默觉得升序),那么我们能够在写 order by 的时候让索引各字段降序/升序一致。终于的 sql 改写为:

select substr(t.acq_ins_code, 3) merAcqInsCode, t.mer_code, t.term_id, substr(t.mer_addr_name, 1, 12) merName,
tt.trans_desc, t.rev_flag, t.trans_amt, concat(substr(t.sys_date, 1, 4), t.trans_datetime) transTime,t.before_trans_code,
t.acct_num, t.retrivl_ref_num, t.resp_code, t.resp_auth_code, r.recv_ins_name,t.acq_ins_code,t.trace_num,t.trans_datetime,
case substr(t.sa_sav2,259,1) when 1 then '借记卡' when 2 then '贷记卡'
when 3 then '准贷记卡' when 4 then '私有预付卡' else '' end cardType,
case
when locate('VIS',t.sa_sav2) > 0 then 'VISA'
when locate('JCB',t.sa_sav2) > 0 then 'JCB'
when locate('DNC',t.sa_sav2) > 0 then '大莱卡'
when locate('CUP',t.sa_sav2) > 0 then '银联境内卡'
when locate('UPI',t.sa_sav2) > 0 then '银联*卡'
else '' end cardBrand
from tbl_direct_pos_201506 t
left join trans_recv_ins r on r.recv_ins_code = t.recv_ins_code
left join tbl_trans_type tt on tt.trans_code = t.before_trans_code
where t.sys_date between '20150622' and '20150628'
order by
t.sys_date desc, t.trans_datetime desc, t.acq_ins_code desc, t.trace_num desc
limit 0, 20;

运行之。0.029 s。搞定。

參考资料