【转载】MySql中的Explain工具

大多数开发者都使用的是Navicat管理数据库,如果你在进行查询的时候也曾注意到过那个 解释按钮,那么你应该知道Explain工具
image.png

1. 什么是Explain工具?

使用EXPLAIN关键字可以模拟优化器执行SQL语句,分析你的查询语句或是结构的性能瓶颈。
就像下图所展示的这样:
image.png

2. explain的两个变种

2.1 explain extended

explain extended会在explain的基础上额外提供一些查询优化的信息。紧随着其后通过show warnings 命令可以得到优化后的查询语句,从而看出优化器优化了什么。额外还有filtered列,是一个半分比的值,rows*filtered/100 可以估算出将要和explain中前一个表连接的行数(前一个表指explain)。

例如SQL语句:

EXPLAIN SELECT * FROM person WHERE salary>2000;
show WARNINGS;

得到的结果是

image.png

image.png

2.1 explain partitions

explain partitions:相比explain多了个partitions字段,如果查询是基于分区表的话,会显示查询将要显示的分区。

MySQL数据库表分区功能详解

mysql数据库中的数据是以文件的形势存在磁盘上的,默认放在/mysql/data下面(可以通过my.cnf中的datadir来查看),一张表主要对应着三个文件,一个是frm存放表结构的,一个是myd存放表数据的,一个是myi存表索引的。如果一张表的数据量太大的话,那么myd,myi就会变的很大,查找数据就会变的很慢,这个时候我们可以利用mysql的分区功能,在物理上将这一张表对应的三个文件,分割成许多个小块,这样呢,我们查找一条数据时,就不用全部查找了,只要知道这条数据在哪一块,然后在那一块找就行了。如果表的数据太大,可能一个磁盘放不下,这个时候,我们可以把数据分配到不同的磁盘里面去。

3. explain中的列

explain中的列在对SQL进行优化的时候很重要,你需要知道大多数列所对应的意思,这样才明白怎么去有针对性的进行优化。

3.1 id列

id列的编号是select的序号,有几个select就有几个id,并且id的顺序是按select出现的顺序增长的。

id列越大执行优先级越高id相同则从上往下执行id为NULL则最后执行

3.2 select_type列

select_type表示对应行是简单还是复杂查询。

3.2.1 simple

simple意味着简单查询。查询不包括子查询和union。例如:

image.png

3.2.2 primary

primary意味着复杂查询中最外层的select

3.2.3 subquery

subquery,包含在select中的子查询,不在from字句中。

3.2.4 derived

derived,包含在from子句中的子查询。MySql会将结果存放在一个临时表中,也称为派生表。

用一个例子来展示primary、subquery、derived类型

首先关闭mysql新特性对衍生表的合并优化

set session optimizer_switch='derived_merge=off';

然后通过sql语句

explain select (select 1 from actor where id = 1) from (select * from film
where id = 1) der;

得到结果

image.png

记得把配置还原回去

set session optimizer_switch='derived_merge=on';

3.3 table列

这一列表示explain的一行正在访问哪个表。

当from字句中有子查询时,table列显示格式,其中这个N表示当前查询依赖id=N的查询,先执行id=N的查询

当有union时,UNION RESULT的table列的值为<union1,2>,1和2表示参与union的select行id

3.4 type列

这一列表示关联类型或访问类型,即MySql决定如何查找表中的行,查找数据记录的大概范围。

依次从最优到最差分别为:system>const>eq_ref>ref>range>index>all

一般来说,我们的查询需要达到range级别,最好达到ref

3.4.1 NULL

NULL:MySql能够在优化阶段分解查询语句,在执行阶段用不着再访问表或索引

例如:再索引列中选取最小值,可以单独查找索引来完成,不需要执行时访问表

explain select min(id) from film;

image.png

3.4.2 const,system

const,system:MySql能对查询的某部分进行优化并将其转换为一个常量(可以看show warnings的结果)。用于primary key或unique key的所有列与常数比较时,所以表最多有一个匹配行,读取一次,速度比较快。system是const的特例,表里只有一条元素匹配时为system

explain extended select * from (select * from film where id = 1) tmp;

image.png

show warnings;

image.png

3.4.3 eq_ref

eq_ref:primary key或union key索引的所有部分被连接使用,最多只会返回一条符合条件的记录。这可能是再const之外最好的联接类型了,简单的select查询不会出现。

explain select * from film_actor left join film on film_actor.film_id = film.id;

image.png

3.4.4 ref

ref:相比eq_ref,不使用唯一索引,而是使用普通索引或者唯一性索引的部分前缀,索引要和某个值相比较,可能会找到多个符合条件的行。

  1. 简单select查询,name是普通索引(非唯一索引)

    explain select * from film where name = 'film1';
    

    image.png

  2. 关联表查询:idx_film_actor_id是film_id和actor_id的联合索引,这里使用到了film_actor
    的左边前缀film_id部分

    explain select film_id from film left join film_actor on film.id = film_actor.film_id;
    

image.png

3.4.5 range

range:范围扫描通常出现再in(),between,>,<,<=等操作中。使用一个索引来检索给定范围的行。

explain select * from actor where id > 1;

image.png

3.4.6 index

index:扫描全表索引,这通常比ALL快一些

explain select * from film;

image.png

3.4.6 ALL

ALL:即全表扫描,意味着mysql需要从头到尾去查找所需要的行。通常情况下这需要增加索
引来进行优化了

explain select * from actor;

image.png

3.5 possible_keys列

这一列显示查询可能使用哪些索引来查找。

explain时可能出现possible_keys列,而key显示null的情况,这种情况时因为表中数据不多,mysql认为索引对此查询帮助不大,选择了全表查询。

如果该列时NULL,则没有相关索引。在这种情况下,可以通过检查where字句看是否可以创造一个适当的索引来提高查询性能,然后用explain查看效果

3.6 key列

这一列显示mysql实际采用哪个索引来优化对表的访问。

这一列如果没有使用索引,则该列显示为NULL。如果想强制mysql使用或忽视possible_keys列中的索引,在查询中使用force index、ignore index

但是实际操作中并不推荐这么去强制改变MySql的查询过程,因为MySql内部做了优化估算不使用索引反而查询的更快。

3.7 key_len列

这一列显示了MySql在索引中使用的字节数,这个值时可以算出具体使用了索引中的哪些列。

举例来说,film_actor的联合索引 idx_film_actor_id 由 film_id 和 actor_id 两个int列组成,
并且每个int是4字节。通过结果中的key_len=4可推断出查询使用了第一个列:film_id列来执
行索引查找。

explain select * from film_actor where film_id = 2;

image.png

3.7.1 key_len计算规则

字符串

  • char(n):n字节长度
  • varchar(n):2字节存储字符串长度,如果是utf-8,则长度 3n+2

数值类型

  • tinyint:1字节
  • smallint:2字节
  • int:4字节
  • bigint:8字节

时间类型

  • date:3字节
  • timestamp:4字节
  • datetime:8字节

如果字段允许为 NULL,需要1字节记录是否为 NULL

索引最大长度是768字节,当字符串过长时,mysql会做一个类似左前缀索引的处理,将前半
部分的字符提取出来做索引

3.8 ref列

这一列显示了在key列记录的索引中,表查找值所用到的列或常量,常见的有:const(常
量),字段名(例:film.id)

3.9 rows列

这一列是mysql估计要读取并检测的行数,注意这个不是结果集里的行数

3.10 Extra列

这一列展示的是额外信息。常见的重要值如下:

3.10.1 Using index

使用覆盖索引

explain select film_id from film_actor where film_id = 1;

image.png

3.10.2 Using where

使用 where 语句来处理结果,查询的列未被索引覆盖

explain select * from actor where name = 'a';

image.png

3.10.3 Using index condition

查询的列不完全被索引覆盖,where条件中是一个前导列的范围;

explain select * from film_actor where film_id > 1;

image.png

3.10.4 Using temporary

mysql需要创建一张临时表来处理查询。出现这种情况一般是要进行优化的,首先是想到用索引来优化

  • actor.name没有索引,此时创建了张临时表来distinct
    explain select distinct name from actor;
    

image.png

  • film.name建立了idx_name索引,此时查询时extra是using index,没有用临时表
    explain select distinct name from film;
    

image.png

3.10.5 Using filesort

filesort,顾名思义是文件排序。

将用外部排序而不是索引排序,数据较小时从内存排序,否则需要在磁盘完成排序。这种情况下一般也是要考虑使用索引来优化的。

  • actor.name未创建索引,会浏览actor整个表,保存排序关键字name和对应的id,然后排
    序name并检索行记录
    explain select * from actor order by name;
    

image.png

  • film.name建立了idx_name索引,此时查询时extra是using index
    explain select * from film order by name;
    

image.png

3.10.6 Select tables optimized away

使用某些聚合函数(比如 max、min)来访问存在索引的某个字段

explain select min(id) from film;

image.png

评论

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×