MySQL 是如何执行查询操作的？

转载：MySQL 是如何执行查询操作的？

作为一名 Java后端程序员，MySQL应该是接触最多的数据库之一，增删改查更 MySQL数据库的常规操作。那么，一条 SQL语句在执行的过程中经历了哪些流程呢？它是如何被 MySQL执行的？这篇文章，我们将详细地分析。

为了更好地理解，我们先来看一下 MySQL的架构。

MySQL架构示意图

MySQL是典型的C/S架构，SQL整个执行流程包括：客户端，Server层和存储引擎层三部分。

C/S架构，C是指 Client 客户端，S是指 Server 服务端。

流程图

MySQL 整个查询执行过程，分为 6 个大步骤，如上图：连接建立、查询缓存、SQL解析、优化SQL查询、调用引擎，返回结果

连接建立：客户端向 MySQL 服务器发送一条查询请求，与 Connectors 交互，进行身份认证、连接分配等操作。如验证通过，会暂时存放在连接池中并由Management Serveices & Utilities 管理。当该请求从等待队列进入到处理队列，管理器会将该请求传递给 SQL Interface
查询缓存：SQL Interface 接收到请求后，首先对请求进行 hash 处理并检查查询缓存，如果命中缓存，则立刻返回存储在缓存中的结果，否则进入后续流程，传递给 Parser
SQL 解析：Parser 对 SQL 进行解析(词法、语法、语义)，将 SQL 转化为语法树，并传递给预处理器
SQL 预处理：预处理器会进行表/字段存在性验证、权限验证等操作，完成后传递给 Optimizer
SQL 优化：Optimizer 结合语法树的语义和目标数据库统计信息生成 MySQL 认为的最佳执行计划
SQL 执行：MySQL 根据执行计划，调用存储引擎的 API 来执行查询
返回结果：将结果返回给客户端，同时如为 select 请求则缓存查询结果

模块分析

1. 客户端

客户端是指连接使用MySQL的终端。常见的MySQL客户端有：java代码，这个是java程序员使用最多的，比如mybatis ORM框架；navicat工具，功能强大，能够可视化操作很多种数据库；mysql-cli，这个是MySQL官方自带的客户端；还有一些网页版的客户端。

2. Server层

Server层是MySQL的核心模块，Server层包含连接器、查询缓存、分析器、优化器、执行器等核心组件，涵盖了MySQL大多数核心服务以及所有的内置函数，诸如存储过程、触发器、视图等所有跨存储引擎的功能也都在Server层实现。下面将分别讲解几个核心组件。

连接器

连接器的主要功能是连接管理和权限校验。当客户端请求过来时，首先是和Server层的连接器交互。

下面通过一个实例来讲解连接层的功能，比如：mysql-cli客户端连接MySQL Server的命令

mysql> mysql -h 127.0.0.1 -P 3306 -uroot -p

整个过程分解为：

输入指令，点击 Enter键后会完成经典的TCP 3次握手，客户端和MySQL Server建立TCP连接。

连接建立后，连接器开始对请求进行权限校验，如果Server层配置需要密码校验，会提醒用户输入密码，密码正确进入下一步，密码错误提醒"Access denied for user"; 如果Server层配置不需要密码校验，则直接进入下一步

权限验证成功后，连接器会从权限表把当前用户的所有权限查询并缓存起来，权限缓存的生命周期一直到该连接关闭。

连接器会把权限缓存，因此，只要该连接一直存在就会使用缓存中的权限，这就意味着，即便服务器更改了该用户的权限，只要是在权限更改前还存活的连接，新的权限不生效。这也能很好地解释，有时候服务端修改了权限配置，客户端不能及时生效。

查询缓存

缓存是 MySQL为了加速查询而设置的，当请求鉴权完成之后，就会到执行缓存查询(Server层开启了缓存)，如果命中缓存，则直接返回，否则进入下一步。不过根据小编剧这么多年的工作经验，缓存使用的场景比较少，比如：MySQL中存放的是一些静态数据或者变更频率特别低，其他的场景这个功能就比较鸡肋了，怎么鸡肋呢？

因为只要对表有更新操作，查询缓存就会失效，如果表的更新和查询操作比较频繁，那么缓存就会一直处于建立和失效的频繁交替中，最终导致查询性能不但没有提升还无形中多维护了缓存。

因此实际生产中，Server层都会设置 query_cache_type=DEMAND，这样SQL默认不会使用查询缓存。如果有特殊需求一定要使用查询缓存，可以显示指定SQL_CACHE，比如下面的SQL语句：

mysql> select SQL_CACHE * from user where id = ?;

分析器

分析器，顾名思义就是SQL语句进行分析，那么，分析器对SQL会做哪些分析呢？通常来说有：词法分析和语法分析两种。

词法分析是判断SQL里面的字符串进行拆解，识别当前SQL是什么操作，SQL里面包含多少字符串，空格等等，比如：下面的sql语句，词法分析器可以根据 select来判断当前SQL是查询操作，id 为需要查询的结果，where 后面的条件等等；

mysql> select id from user where name = 'zhangsan';

语法分析就是检查SQL的语法是否正确，比如下面的SQL语句，把update 错误的写成了 updater，因此语法分析器就能识别该SQL有语法错误，抛出语法错误相关的异常。

mysql> updater user set update_time = now() where id = 10;

优化器

优化器目的是对SQL语句进行优化处理。因为SQL语句的编写者能力不一样，编写出来的SQL语句性能也不一样。Server层如果完全按照SQL语句顺序执行，可能会造成性能问题，所以需要优化，判断语句能否使用索引等。比如下面的场景：

假如：5000万数据的user表中原存在一个组合索引是index_name_age(name,age)，某工程师在没有查看现有索引的情况下编写了如下的SQL语句：

mysql> select * from user where age = 30 and name like '张%';

假如 MySQL server层完全按照SQl语句的顺序执行，则该SQL语句不会使用索引，必定会成为慢sql。而有了优化器，语句就可以优化成下面的形式，完全使用上现有的index_name_age(name,age)索引。这下可以是不是看出了优化器的好处。

mysql> select * from user where name like '张%' and age = 30;

执行器

执行器就是运行SQL语句。不过，此处执行器不会在Server层直接执行SQL语句，而是根据数据表中执行引擎类型调用对应的存储引擎提的接口。至于，为什么执行引擎不亲自执行SQL语句，我们会后期进行分享。不过MySQL此处的设计符合了SOLID软件设计原则的依赖倒置原则。

3. 存储引擎层

存储引擎层负责数据的存储和提取。采用插件式的架构模式，常见的存储引擎有 InnoDB、MyISAM、Memory等。其中MyISAM是MySQL官方自带的引擎，但是因为该引擎不支持事务，使得能够支持事务的InnoDB存储引擎得以快速发展，并在MySQL 5.5.5版本夺嫡成功，成为了默认存储引擎

因此，作为开发，在进入新公司后，最好是要弄清楚公司的MySQL版本以及默认引擎，这样可以避免很多不必要的坑。查看指令如下：

# 查看数据库版本
mysql> status;

# 查看默认引擎
mysql> SHOW VARIABLES LIKE 'default_storage_engine%';

总结

本文，我们详细分析了一条 SQL查询语句在 MySQL中的全部执行流程。通过了解这些流程，可以帮助我们更好的理解 MySQL的内部结构和原理，以及 vvvMySQL的优化原理。：

SQL执行会经历客户端、Server层、存储引擎层 3个部分。
Server层包含连接器、查询缓存、分析器、优化器、执行器等核心组件。
连接器主要职责是管理连接，权限校验
查询缓存主要职责是为查询提供缓存
分析器主要职责是词法分析和语法分析，目的是识别SQL是做什么，有没有语法错误。
优化器主要职责是关注SQL的性能，优化SQL语句怎么更好的去执行，比如：匹配索引，优化join查询的连接顺序。
执行器主要职责是调用存储引擎调的接口和返回结果。
存储引擎主要职责是数据的存储和提取，给执行器提供接口。

92IT

Just love IT.

MySQL 是如何执行查询操作的？