mysql对binlog的处理说明

2021年10月27日 08:52:37数据库评论543字数 1962阅读模式

Mysql和其它开源数据库相比，具有更好的扩展性。其主要原因是它提供了存储引擎的开放接口。喜欢自己折腾数据库的程序员可以从这个接口起步，打造有个性的数据库。

然而这里不打算对某种存储引擎的实现细节进行描述，也不打算介绍各种存储引擎的优缺点，只是描述一下mysql如何处理binlog，并澄清几个容易混淆的问题。文章源自很文博客https://www.hinvn.com/很文博客-https://www.hinvn.com/15362.html

Binlog对mysql而言是重要的，主要体现在它的功能上。Mysql官方文档明确指出，binlog的启动大概会为mysql增加1%的负载，因此在绝大多数情况下，binlog都不会成为mysql的性能瓶颈。文章源自很文博客https://www.hinvn.com/很文博客-https://www.hinvn.com/15362.html

Binlog是mysql以二进制形式打印的日志，它默认不加密，不压缩。每个正常的binlog文件头部，有4个字节的标记，值为0xfe 0x62 0x69 0x6e。LOG_EVENT是binlog里的单位，即正常情况下binlog按照逐LOG_EVENT的形式增长。除去头部的标记，binlog就是一个LOG_EVENT的序列。每个LOG_EVENT都独立单元，没有互相引用的关系，它也有自己的二进制头部，主要是记录了时间戳、类型标记等描述信息。文章源自很文博客https://www.hinvn.com/很文博客-https://www.hinvn.com/15362.html

Mysql把磁盘操作的实现封装在IO_CACHE结构里，这也方便了我们对binlog的研究和描述，后文如果没有特别说明，读写binlog与读写IO_CACHE的含义相同。文章源自很文博客https://www.hinvn.com/很文博客-https://www.hinvn.com/15362.html

为了解mysql写入binlog的过程，可以找一个sql语句的处理过程进行跟踪。以update为例，在最简单的情况下，mysql会先调用为存储引擎开放的接口ha_update_row，然而执行binlog_query对binlog进行写操作。这样处理的原因是，在主从备份的场景下，如果主库先写入binlog成功、在执行update的过程中crash，从库有可能执行update成功，此时主库重启之后，与从库的数据不一致。如果update操作发生在事务性的表上，在写入binlog之后会执行开放接口ha_autocommit_or_rollback，由存储引擎判断操作结果。文章源自很文博客https://www.hinvn.com/很文博客-https://www.hinvn.com/15362.html

在主从备份的场景下，主库相当于server，从库相当于client，双方采用tcp短连接。从库发出读取日志的请求，主库接收请求、读取本地binlog、然后发送给从库。从库接收日志，进行简单校验后写本地日志，称为relay log。此处从库的流程专门由一个线程负责，称为同步io线程。从库还有一个线程，称为同步sql线程。它的行为是，定期读取relay log，解析并执行同步过来的sql语句。文章源自很文博客https://www.hinvn.com/很文博客-https://www.hinvn.com/15362.html

下面回答几个问题：文章源自很文博客https://www.hinvn.com/很文博客-https://www.hinvn.com/15362.html

1. binlog的格式？

二进制顺序存储，不加密，不压缩

2.binlog使用WAL吗？

3.主库发送binlog，是使用内存里的copy吗？

无法确定，很有可能是先从磁盘上读一份，然后发送。

4. relaylog使用WAL吗？

Yes。从库接收到日志后，会先写relay log

5. binlog和relaylog的SQL是否一致？

在网络传输正确性可靠的前提下，yes

提一个问题：

既然binlog不使用WAL，那么在主从场景下，mysql异常之后，主库和从库是否会不一致呢？