《高性能Mysql》学习笔记（一）

前言

Mysql的质量比较好的书其实并不是很多，所以可以说是看一本少一本，这本书也算是学习MYSQL必看的一本书，当然十分厚，虽然版本很老但是讲述的内容都会十分实用的，对于学习MYSQL的人可以说是一本必读的进阶好书。

最后，这篇读书笔记是整理个人以前自学的时候看书做的笔记，做的十分粗糙=-=，现在来看很多笔记记得过于基础了。另外当时很多都是截图的，很多都是图片HHHH（流量观看慎重）。

MySQL逻辑架构图

虽然看上去比较复古，但是挺经典的。

❝
「小贴士：」

存储引擎不会去解析sql，不同存储引擎不会相互通信，只是简单响应上层请求（「InnoDB引擎除外，会解析外键定义，因为mysql服务器本身没有实现该功能」）
❞

连接管理和安全性

每一个连接都是一个单独线程，服务器会对连接「缓存」而不是创建或者销毁线程

优化与执行

执行流程：

解析查询
创建数据结构（解析树），优化（重写查询，读表顺序优化，选择索引等）
尝试查询缓存（SELECT）
返回结果

并发控制

目的：内部拥有锁机制防止数据破坏

共享锁和排他锁（读锁和写锁）

读锁是共享的，相互不阻塞
写锁是排他的，一个写锁会阻止其他读锁和写锁

锁粒度

提高共享资源并发性就是让锁更有选择性，让锁只监控部分数据

记住：「任何时候，给定资源下，锁定数据量越少，并发程度越高，只要相互不发生冲突即可」

mysql提供多个存储引擎支持丰富的锁策略

表锁 (table lock)

表锁是msyql中最基本的锁策略，开销最小的策略，这种方式类似邮箱的加锁机制：会锁定整张表，用户访问时候，对表进行写操作，需要优先获得写锁，会阻塞其他用户读写操作，「只有没有写锁时候，其他用户才能获得读锁」，读锁之间是不相互阻塞的，特定场景表锁可以有良好性能。

注意事项：

「写锁」比「读锁」有「更高的优先级」，写锁有可能会插入到一个读锁的前面，但是读锁不能插入到写锁队列前面
服务器会为alter table 等语句默认使用表锁而不是根据引擎决定（虽然存储引擎才是真正干活的）

行级锁 (row lock)

该锁可以「最大程度支持」并发处理（与此同时带来巨大锁开销），「InnoDB」和「XtraDB」，实现了行级锁，行级锁只在存储层也就是存储引擎实现，而mysql服务层没有实现

事务

事务的ACID

「A（atomicity）原子性」
- 一个事务是一个不可分割的单位，事务中的所有操作，要么全完成，要么全不完成，任何一个操作的失败，都会回滚到事务执行之前的状态。
「C （consistency）一致性」
- 事务结束后，系统状态是一致的。即，在并发操作时，系统的状态也要和串行执行事务时一样。
「I （isolation）隔离性」
- 并发执行的事务之间，无法看到彼此的系统状态。
「D （durability）持续性」
- 在事务完成后，事务对数据库的操作会被持久保存在数据库中，不会被回滚。

事务使用与否根据实际业务情况而定（甚至可以不使用事务，而是使用sql 进行一定的安全措施），如何选择合适的 mysql 引擎来解决问题可能事务本身更加重要。

隔离级别

死锁

如果多个线程同时更改同一行数据，你们两个线程互相等待对面的锁，造成死锁

解决方法：

例如：InnoDB 检测死循环依赖，并且立即返回一个错误（死锁会造成慢查询）。
查询时间达到锁等待超时设定时间之后放弃锁请求。
InnoDB目前（5.1）处理方法：「将持有最少行级排他锁的事务进行回滚」。
大多数时候因为数据冲突，有时候确实是因为存储引擎方式引起的！！！

❝
只有部分或者完全回滚一个事务才能打破死锁，事务性系统无法避免。「大多数时候只需要重新执行死锁事务即可」
❞

事务日志

事务日志采用追加方式，因此I/O的消耗比较小，内存修改数据后台慢慢刷会磁盘，目前大多数存储引擎都是这样实现被称为：「预写式日志」

mysql中的事务

innoDB
NDB cluster

自动提交

默认情况下我们所写的SQL默认都是自动提交的，也就是说在执行的时候MYSQL都会给我们自定加上一条，COMMIT语句，也就是自动提交事务，我们可以使用SHOW VARIABLES LIKE 'AUTOCOMMIT'语句查看是否开启自动提交。

切记：查找对应版本会产生 「AUTO_COMMIT」 所有语句

设置隔离级别

命令如下：

> SET SESSION TRASACTION ISOLATTION LEVEL READ COMMITTED

mysql 可以识别 4 个 ansi 隔离级别，innodb 引擎也支持

混合使用存储引擎

mysql 服务层不管理事务，事务下层存储引擎实现，同一个事务使用多种存储引擎不可靠

「mysql 对非事务型表不会有提示！！！！」

「mysql 对非事务型表不会有提示！！！！」

「mysql 对非事务型表不会有提示！！！！」

隐藏和显式锁定

记住下面的两条特点：

INNODB 使用两阶段锁定协议，锁只有在执行提交或者回滚才会释放
INNODB 会根据隔离级别自动加锁

innodb支持显示的加锁如下：

SELECT ... FROM IN SHARE MODE
SELECT ... FOR UPDATE

❝
注意：这不是sql规范，而是MYSQL自己增加的语法支持
❞

mysql 中的「lock 和 unlock tables 语句和存储引擎无关」，而是在**服务层**实现，「不能用来替代事务性存储引擎」，有其他用途

❝
建议：除了事务中禁用autocommit ，可以使用lock tables 之外，其他任何时候不要显式执行 lock tables，不管是什么存储引擎
❞

多版本并发控制（mvcc）

mvcc实现：保存数据在某个时间点的快照实现，记住：根据事务开始时间不同，每个事务对同一张表，同一时刻看到的数据可能是不一样的，这里可以引申：「悲观锁」和「乐观锁」

innodb 的 mvvc

实现原理：通过在每行记录后面保存两个隐藏的列实现

一个列保存行创建时间
另一个保存过期时间（删除时间）

事务开始时候系统版本号（每个新事务都会递增版本号）作为事务版本号，和查询到记录的版本号比较

REPEATABLE READ 隔离级别操作

MVCC 只在 「REPEATABLE READ」 和 「READ COMMITTED」 两个隔离级别工作。

mysql 存储引擎

建表时候，会在mytable.frm中定义表定义。
表的定义是在「服务层」。
不同系统存储形式不一样（数据和索引）。

使用show table status命令显示表的相关信息，例如 show table status like 'user' \G，mysql5.1中的innodb plugin支持一些新特性（BLOB存储方式使用），mysql5.1一定要使用 innodb plugin ，比旧innodb要好得多

❝
mysql 5.5 之后 innodb plugin 才替换掉旧的 Innodb
❞

Innodb 概览

「mysql4.1」之后新特性

innodb 可以将每个表的数据和索引放在单独文件当中
innodb 可以将裸设备作为存储介质

Innodb 特点

使用mvcc 支持高并发
实现了四个标准隔离级别（默认级别为 「REPEATABLE READ」(可重复读)）。
使用间隙锁(next-key locking) 策略防止幻读的出现。
间隙锁不仅锁定查询行，还对索引进行锁定。
INNODB 基于 「聚簇索引」 建立。
存储格式是平台独立的，意味着可以跨平台使用。
内部进行优化，「可预测性预读」，可以自动在「内存」当中「创建hash索引」加速读操作「自适应哈希索引」，加速操作的加入缓冲区。
阅读官方文档"InnoDB 事务模型和锁"了解更多内容。
innodb 通过一些机制和工具实现真正的「热备份」。

❝
聚簇索引对于主键查询有非常高的性能，不过二级索引中必须包含主键列，「如果主键列很大，其他所有索引都会很大」，
❞

Myisam 存储引擎

mysql5.1 之前默认使用 MyISAM 作为存储引擎

特点：

全文索引，压缩，空间函数
「不支持事务和行级锁」
崩溃之后无法安全恢复

存储：

将表存储在两个文件当中

数据文件 ( .MYD )
索引文件 ( .MYI )
表支持包含动态或者静态（长度固定）行，mysql根据表定义决定存储形式
Mysql5 当中，如果是变长行，只能处理256TB 数据
修改Myisam 表指针长度，修改表 「max_rows」 和 「avg_row_length」 选项实现

myisam特性

加锁与并发：对「整张表」加锁，而不是针对行。
myisam 表， mysql 可以手工或者自动检查和修复操作（但是效率较低）。
索引特性：即使是BLOB 和 TEXT等长字段，也可以基于500 个字符创建。
myisam 支持「全文索引」，基于分词创建索引。
延迟更新索引键。

myisam 压缩表

如果表中数据不再修改，可以使用myisam 压缩表，作用是减少磁盘i/o，提高查询性能。

myisam 性能问题

最典型的性能问题是 「表锁」 的问题

mysql 内建其他存储引擎

Archive 引擎

只支持 insert 和 sleect， mysql5.1 之前不支持索引。
适合日志和数据采集类应用。
支持行级锁和专用缓冲区，实现高并发插入。
不是事务性引擎，只对告诉插入和压缩做了优化的简单引擎。

Blackhole 引擎

无存储，丢弃所有插入数据。但是服务器会记录blackhole 表的日志。
简单的日志引擎。

「CVS 引擎」

将普通cvs 作为mysql 表处理，「不支持索引」。
cvs 引擎可以作为数据交换的机制（excel 表格的转换）。

Federated 引擎

访问其他mysql 服务器代理，但是默认是「禁用」的。

「Memory引擎」

可以快速访问数据使用 Memory 表。
所有数据都是在内存当中。
每行长度固定。
并发性能较低。
作用：
1. 查找或者映射表。
2. 缓存周期性聚合数据。
3. 保存数据产生的中间数据。
如果mysql 查询使用临时表保存结果，你们内部使用就是Memory 表，但是如果数据量较大，就会转为myisam 表

Merga 引擎

myisam 引擎变种，多个myisam 表合并变种
分区功能实现后，被放弃
「NDB 集群引擎」
1. 用于mysql 集群

第三方存储引擎

OLTP 类引擎

XtraDB引擎
PBXT引擎
TokuDB 引擎

如何选择引擎

除非使用到了innodb 不具备的特性，并且无法替代，否则优先选择innodb

主要看待四点

事务
备份
崩溃恢复
特有特性

个人看法：

对于极高的插入数据要求时候，可以使用myisam 或者archieve
如果不知道其他引擎的特性还是建议INNODB

❝
测试崩溃数据恢复问题就是模拟电源断电！！！
❞

数据表引擎转换

1. 直接转换

mysql> ALTER TABLE mytable ENGINE = InnoDB

这种方式性能很低，而且会加锁

2. 使用导入导出的方法

导入与导出：使用msyql 工具导出sql 语句然后手动修改引擎

3. 创建与查询

mysql > create table innodb_table like myisam table;
mysql > alter table innodb_table engine = InnoDB;
mysql > insert into innodb_table select * from myisam_table

4. 数据量很大的话可以分批处理

start transaction;
insert into innodb_table select * from myisam_table 
where id between x and y;

insert into innodb_table select * from myisam_table 
where id between x and y;

insert into innodb_table select * from myisam_table 
where id between x and y;

.......

commit

总结

第一篇读书笔记主要介绍了和MYSQL的存储引擎的重点内容，以及简单介绍MYSQL 的事务相关内容，在前言也说过，内容比较基础并且由于以前偷懒很多都是截图书上的内容=-=。