2021-03-15 09:37:28

后端

【转载】MySql中的Explain工具

大多数开发者都使用的是Navicat管理数据库，如果你在进行查询的时候也曾注意到过那个 解释按钮，那么你应该知道Explain工具

1. 什么是Explain工具？

使用EXPLAIN关键字可以模拟优化器执行SQL语句，分析你的查询语句或是结构的性能瓶颈。
就像下图所展示的这样：

2. explain的两个变种

2.1 explain extended

explain extended会在explain的基础上额外提供一些查询优化的信息。紧随着其后通过show warnings 命令可以得到优化后的查询语句，从而看出优化器优化了什么。额外还有filtered列，是一个半分比的值，rows*filtered/100 可以估算出将要和explain中前一个表连接的行数（前一个表指explain）。

例如SQL语句：

EXPLAIN SELECT * FROM person WHERE salary>2000;
show WARNINGS;

得到的结果是

2.1 explain partitions

explain partitions:相比explain多了个partitions字段，如果查询是基于分区表的话，会显示查询将要显示的分区。

MySQL数据库表分区功能详解

mysql数据库中的数据是以文件的形势存在磁盘上的，默认放在/mysql/data下面（可以通过my.cnf中的datadir来查看），一张表主要对应着三个文件，一个是frm存放表结构的，一个是myd存放表数据的，一个是myi存表索引的。如果一张表的数据量太大的话，那么myd,myi就会变的很大，查找数据就会变的很慢，这个时候我们可以利用mysql的分区功能，在物理上将这一张表对应的三个文件，分割成许多个小块，这样呢，我们查找一条数据时，就不用全部查找了，只要知道这条数据在哪一块，然后在那一块找就行了。如果表的数据太大，可能一个磁盘放不下，这个时候，我们可以把数据分配到不同的磁盘里面去。

3. explain中的列

explain中的列在对SQL进行优化的时候很重要，你需要知道大多数列所对应的意思，这样才明白怎么去有针对性的进行优化。

3.1 id列

id列的编号是select的序号，有几个select就有几个id，并且id的顺序是按select出现的顺序增长的。

id列越大执行优先级越高，id相同则从上往下执行，id为NULL则最后执行

3.2 select_type列

select_type表示对应行是简单还是复杂查询。

3.2.1 simple

simple意味着简单查询。查询不包括子查询和union。例如：

3.2.2 primary

primary意味着复杂查询中最外层的select

3.2.3 subquery

subquery，包含在select中的子查询，不在from字句中。

3.2.4 derived

derived，包含在from子句中的子查询。MySql会将结果存放在一个临时表中，也称为派生表。

用一个例子来展示primary、subquery、derived类型

首先关闭mysql新特性对衍生表的合并优化

set session optimizer_switch='derived_merge=off';

然后通过sql语句

explain select (select 1 from actor where id = 1) from (select * from film
where id = 1) der;

得到结果

记得把配置还原回去

set session optimizer_switch='derived_merge=on';

3.3 table列

这一列表示explain的一行正在访问哪个表。

当from字句中有子查询时，table列显示格式，其中这个N表示当前查询依赖id=N的查询，先执行id=N的查询

当有union时，UNION RESULT的table列的值为<union1,2>,1和2表示参与union的select行id

3.4 type列

这一列表示关联类型或访问类型，即MySql决定如何查找表中的行，查找数据记录的大概范围。

依次从最优到最差分别为：system>const>eq_ref>ref>range>index>all

一般来说，我们的查询需要达到range级别，最好达到ref

3.4.1 NULL

NULL：MySql能够在优化阶段分解查询语句，在执行阶段用不着再访问表或索引。

例如：再索引列中选取最小值，可以单独查找索引来完成，不需要执行时访问表

explain select min(id) from film;

3.4.2 const,system

const,system：MySql能对查询的某部分进行优化并将其转换为一个常量（可以看show warnings的结果）。用于primary key或unique key的所有列与常数比较时，所以表最多有一个匹配行，读取一次，速度比较快。system是const的特例，表里只有一条元素匹配时为system。

explain extended select * from (select * from film where id = 1) tmp;

show warnings;

3.4.3 eq_ref

eq_ref：primary key或union key索引的所有部分被连接使用，最多只会返回一条符合条件的记录。这可能是再const之外最好的联接类型了，简单的select查询不会出现。

explain select * from film_actor left join film on film_actor.film_id = film.id;

3.4.4 ref

ref：相比eq_ref，不使用唯一索引，而是使用普通索引或者唯一性索引的部分前缀，索引要和某个值相比较，可能会找到多个符合条件的行。

简单select查询，name是普通索引（非唯一索引）
```
explain select * from film where name = 'film1';
```
关联表查询：idx_film_actor_id是film_id和actor_id的联合索引，这里使用到了film_actor
的左边前缀film_id部分
```
explain select film_id from film left join film_actor on film.id = film_actor.film_id;
```

3.4.5 range

range：范围扫描通常出现再in(),between,>,<,<=等操作中。使用一个索引来检索给定范围的行。

explain select * from actor where id > 1;

3.4.6 index

index：扫描全表索引，这通常比ALL快一些

explain select * from film;

3.4.6 ALL

ALL：即全表扫描，意味着mysql需要从头到尾去查找所需要的行。通常情况下这需要增加索
引来进行优化了

explain select * from actor;

3.5 possible_keys列

这一列显示查询可能使用哪些索引来查找。

explain时可能出现possible_keys列，而key显示null的情况，这种情况时因为表中数据不多，mysql认为索引对此查询帮助不大，选择了全表查询。

如果该列时NULL，则没有相关索引。在这种情况下，可以通过检查where字句看是否可以创造一个适当的索引来提高查询性能，然后用explain查看效果

3.6 key列

这一列显示mysql实际采用哪个索引来优化对表的访问。

这一列如果没有使用索引，则该列显示为NULL。如果想强制mysql使用或忽视possible_keys列中的索引，在查询中使用force index、ignore index

但是实际操作中并不推荐这么去强制改变MySql的查询过程，因为MySql内部做了优化估算不使用索引反而查询的更快。

3.7 key_len列

这一列显示了MySql在索引中使用的字节数，这个值时可以算出具体使用了索引中的哪些列。

举例来说，film_actor的联合索引 idx_film_actor_id 由 film_id 和 actor_id 两个int列组成，
并且每个int是4字节。通过结果中的key_len=4可推断出查询使用了第一个列：film_id列来执
行索引查找。

explain select * from film_actor where film_id = 2;

3.7.1 key_len计算规则

字符串

char(n)：n字节长度
varchar(n)：2字节存储字符串长度，如果是utf-8，则长度 3n+2

数值类型

tinyint：1字节
smallint：2字节
int：4字节
bigint：8字节

时间类型

date：3字节
timestamp：4字节
datetime：8字节

如果字段允许为 NULL，需要1字节记录是否为 NULL

索引最大长度是768字节，当字符串过长时，mysql会做一个类似左前缀索引的处理，将前半
部分的字符提取出来做索引

3.8 ref列

这一列显示了在key列记录的索引中，表查找值所用到的列或常量，常见的有：const（常
量），字段名（例：film.id）

3.9 rows列

这一列是mysql估计要读取并检测的行数，注意这个不是结果集里的行数

3.10 Extra列

这一列展示的是额外信息。常见的重要值如下：

3.10.1 Using index

使用覆盖索引

explain select film_id from film_actor where film_id = 1;

3.10.2 Using where

使用 where 语句来处理结果，查询的列未被索引覆盖

explain select * from actor where name = 'a';

3.10.3 Using index condition

查询的列不完全被索引覆盖，where条件中是一个前导列的范围；

explain select * from film_actor where film_id > 1;

3.10.4 Using temporary

mysql需要创建一张临时表来处理查询。出现这种情况一般是要进行优化的，首先是想到用索引来优化

actor.name没有索引，此时创建了张临时表来distinct
```
explain select distinct name from actor;
```

film.name建立了idx_name索引，此时查询时extra是using index,没有用临时表
```
explain select distinct name from film;
```

3.10.5 Using filesort

filesort，顾名思义是文件排序。

将用外部排序而不是索引排序，数据较小时从内存排序，否则需要在磁盘完成排序。这种情况下一般也是要考虑使用索引来优化的。

actor.name未创建索引，会浏览actor整个表，保存排序关键字name和对应的id，然后排
序name并检索行记录
```
explain select * from actor order by name;
```

film.name建立了idx_name索引,此时查询时extra是using index
```
explain select * from film order by name;
```

3.10.6 Select tables optimized away

使用某些聚合函数（比如 max、min）来访问存在索引的某个字段

explain select min(id) from film;

# mysql 数据库