做一份最全的MySql索引优化,覆盖到工作的方方面面。
创建示例表:
CREATE TABLE `employees` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(24) NOT NULL DEFAULT '' COMMENT '姓名',
`age` int(11) NOT NULL DEFAULT '0' COMMENT '年龄',
`position` varchar(20) NOT NULL DEFAULT '' COMMENT '职位',
`hire_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '入职时间', PRIMARY KEY (`id`),KEY `idx_name_age_position` (`name`,`age`,`position`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8 COMMENT='员工记录表';
INSERT INTO employees(name,age,position,hire_time) VALUES('LiLei',22,'manager',NOW());
INSERT INTO employees(name,age,position,hire_time) VALUES('HanMeimei',23,'dev',NOW());
INSERT INTO employees(name,age,position,hire_time)VALUES('Lucy',23,'dev',NOW());
1. 全值匹配
1.1 例1
EXPLAIN SELECT * FROM employees WHERE name='lilei'

得到的结果中ken_len为74,这个结果是怎么计算出来的呢?
首先我们要知道MySql查询走索引并不是根据查询语句中的
select * FROM employees WHERE name='lilei'
,中的 * 来判断的,而是根据 where 条件后的限制决定是否走索引,所以在上面这条语句中,走索引的字段只有 name
从上一篇MySql中的Explain工具- key_len计算规则 知道 $[74 = name.length(24)\cdot 3+2]$
诶,这时候有聪明的同学就要问了,我创建的联合索引明明是三个字段呀,而且查询出的结果key对应的也是联合索引 idx_name_age_position
,那么应该是$[name.length(24)\cdot 3+2 + 4 + position.length(20)\cdot 3+2 = 140]$ 才对呀。
错!因为,查询的时候,如果查询了多个字段比如A、B,而ABC构成了联合索引,那么AB会走索引,C并不会。
再来一个例子
1.2 例2
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22;

此时$[ken_len(78) = name.length(24)*3 + 2 + 4] $
1.3 例3
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22 AND position ='manager';

$$
[ken_len(140) = name.length(24)*3 + 2 + 4 + position.length(20)*3+2]
$$
2. 最左前缀法则
如果索引了多列,要遵守最左前缀法则。指的是查询从索引的最左前列开始并且不跳过索引中的列
先来看三条SQL语句
EXPLAIN SELECT * FROM employees WHERE age = 22 AND position ='manager';
EXPLAIN SELECT * FROM employees WHERE position = 'manager';
EXPLAIN SELECT * FROM employees WHERE name = 'LiLei';
在这三条SQL中,之后最后一条SQL走索引,前面两条都是没有走索引的,虽然查询的字段名在联合索引中,但是没有遵循最左前缀法则。
EXPLAIN SELECT * FROM employees WHERE age = 22 AND position ='manager';

EXPLAIN SELECT * FROM employees WHERE position = 'manager';

EXPLAIN SELECT * FROM employees WHERE name = 'LiLei';

假如联合索引是(A、B、C),查询时的条件时A、C,那么只会走A的索引,而不会走C的。
3. 不在索引列上做任何操作(计算、函数、类型转换),会导致索引失效而转向全表扫描
EXPLAIN SELECT * FROM employees WHERE name = 'LiLei';
EXPLAIN SELECT * FROM employees WHERE left(name,3) = 'LiLei';
上面两条SQL中,第一条SQL走索引,第二条不走索引。
EXPLAIN SELECT * FROM employees WHERE left(name,3) = 'LiLei';

日期格式比较特殊,拿出来单独说说
先给hire_time增加一个普通索引:
ALTER TABLE `employees` ADD INDEX `idx_hire_time` (`hire_time`) USING BTREE ;
SQL
EXPLAIN select * from employees where date(hire_time) ='2018-09-30';
这条语句也是不会走索引的,因为其中将字段hire_time转化为字符串再进行比较了

转化为日期范围查询,便会走索引
EXPLAIN select * from employees where hire_time >='2018-09-30 00:00:00' and hire_time <='2018-09-30 23:59:59';

还原最初索引状态
ALTER TABLE `employees` DROP INDEX `idx_hire_time`;
4. 存储引擎不能使用索引中范围条件右边的列
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22 AND position ='manager';
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age > 22 AND position ='manager';
上述两条SQL中,第一条走的索引字段name age position都走了,第二条只走了前两个字段的索引。
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22 AND position ='manager';

EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age > 22 AND position ='manager';

5. 尽量使用覆盖索引(只访问索引的查询(索引列包含查询列)),减少select *语句
EXPLAIN SELECT name,age FROM employees WHERE name= 'LiLei' AND age = 23 AND position ='manager';
走索引

EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 23 AND position ='manager';

6. MySql在使用(!=或者><)not in ,not exists的时候可能无法使用索引会导致全表扫描
< 小于、 > 大于、 <=、>= 这些,mysql内部优化器会根据检索比例、表大小等多个因素整体评估是否使用索引
EXPLAIN SELECT * FROM employees WHERE name != 'LiLei';

7. is null,is not null 一般情况下也无法使用索引
EXPLAIN SELECT * FROM employees WHERE name is null

8. like以通配符开头('$abc...')mysql索引失效会变成全表扫描操作
8.1 通配符在前
EXPLAIN SELECT * FROM employees WHERE name like '%Lei'

8.2 通配符在后
EXPLAIN SELECT * FROM employees WHERE name like 'Lei%'

那么如果需要使用到 like '%字符串%'
的语句,但是又想走索引该怎么办呢?
-
使用覆盖索引,查询字段必须时建立覆盖索引字段 ```
EXPLAIN SELECT name,age,position FROM employees WHERE name like '%Lei%';

-
如果不能使用覆盖索引则可能需要借助搜索引擎
9. 字符串不加单引号索引失效
EXPLAIN SELECT * FROM employees WHERE name = '1000';
EXPLAIN SELECT * FROM employees WHERE name = 1000;
为什么会导致这样的情况呢?因为name字段时varchar,但是条件是1000,比较1000的时候需要添加函数进行转换,添加了函数那就不会走索引了。

10. 少用or或in
用它查询时,MySql不一定使用索引,MySql内部优化器会根据检索比例、表大小等多个因素整体评估是否使用索引,详见范围查询优化。
EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' or name = 'HanMeimei';

11. 范围查询优化
给年龄添加单值索引
ALTER TABLE `employees` ADD INDEX `idx_age` (`age`) USING BTREE ;
SQL
explain select * from employees where age >=1 and age <=2000;

没走索引原因:MySql内部优化器会根据检索比例、表大小等多个因素整体评估是否使用索引。
这个例子中,可能是由于单词查询数据量过大导致优化器最终选择不走索引
优化方法:可以将大的范围拆分成多个小范围
explain select * from employees where age >=1 and age <=1000;
explain select * from employees where age >=1001 and age <=2000;

还原最初索引状态
ALTER TABLE `employees` DROP INDEX `idx_age`;
12.索引使用总结
假设索引index(a,b,c)
where语句 | 是否被使用 |
where a = 3 | 是,使用到a |
where a = 3 and b=5 | 是,使用到a,b |
where a = 3 and b=5 and c = 4 | 是,使用到a,b,c |
where a = 3 或者 where b=3 and c=4 或者 where c=4 | 否 |
where a = 3 and c=5 | 使用到a,但是c不可以,b中间断了 |
where a = 3 and b>4 and c=5 | 使用到a和c,c不能用在范围之后,b断了 |
where a = 3 and b like 'kk%' and c=4 | 是,使用到a,b,c |
where a = 3 and b like '%kk' and c=4 | 是,只用到a |
where a = 3 and b like '%kk%' and c=4 | 是,只用到a |
where a = 3 and b like 'k%kk%' and c=4 | 是,使用到a,b,c |