MySQL之深入InnoDB存储引擎——Checkpoint机制

这篇具有很好参考价值的文章主要介绍了MySQL之深入InnoDB存储引擎——Checkpoint机制。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、引入

由于页的操作首先都是在缓冲池中完成的,那么如果一条DML语句改变了页中的记录,那么此时页就是脏的,即缓冲池中页的版本要比磁盘的新。那么数据库需要将新版本的页刷新到磁盘。倘若每次一个页发生变化就刷新,那么开销会很大,若热点数据集中在某几个页中,那么数据库的性能将变得非常差。

同时如果在缓冲池将新版本的页刷新到磁盘时发生了宕机,那么数据就不能恢复了。为了避免发生数据丢失的问题,当前事务数据库普遍都采用了 Write Ahead Log 策略,即当事务提交时,先写重做日志,再修改页。当由于发生宕机而导致数据丢失时,通过重做日志来完成数据的恢复,从而满足事务的持久性要求。

如果说重做日志可以无限地增大,同时缓冲池也足够大,能够缓冲所有数据库的数据,那么是不需要将缓冲池中页的新版本刷回磁盘。因为发生宕机时完全可以通过重做日志来恢复数据库系统的数据到宕机发生的情况。然而现实是这两个条件是很难满足的,即使满足了,那么如果数据库运行了很久后发生宕机,那么使用重做日志进行恢复的时间也会非常的久。即缓冲池的容量和重做日志容量是有限的,所以需要定期将脏页刷回磁盘,在这样的情况下,引入了 Checkpoint(检查点)技术。

所谓 Checkpoint,是指一个触发点(时间点),当发生 Checkpoint 时,会将脏页(数据脏页和日志脏页)写回磁盘。总的来说,Checkpoint 是数据库管理系统中的一个操作,用于将脏页刷新到磁盘,以确保数据的持久性和一致性。

二、LSN

LSN 称为日志的逻辑序列号(log sequence number),是日志空间中每条日志的结束点,用字节偏移量来表示。在 InnoDB 存储引擎中,LSN 占8个字节,LSN 的值会随着日志的写入而逐渐变大。除了重做日志,每个页(在每个数据页的头部 FILE_HEADER 部分,有一个 FIL_PAGE_LSN 记录了该数据页最后被修改的日志序列位置)以及 Checkpoint 也会被分配一个LSN,以便在需要时可以按照顺序进行检索和恢复。

即 Checkpoint 是通过LSN实现,其由一个 LSN 表示,用来记录已经刷回磁盘的最新页的版本

可以通过show engine innodb status来观察 redo log 里的 checkpoint,结果如下:

......
---
LOG
---
Log sequence number          38890249625                                                                                                                                             
Log buffer assigned up to    38890249625                                                                                                                                             
Log buffer completed up to   38890249625                                                                                                                                             
Log written up to            38890249625                                                                                                                                             
Log flushed up to            38890249625                                                                                                                                             
Added dirty pages up to      38890249625                                                                                                                                             
Pages flushed up to          38890249625                                                                                                                                             
Last checkpoint at           38890249625  
......
  • log sequence number 就是当前的 redo log (in buffer) 中的 LSN;
  • log flushed up to 是刷到 redo log file 磁盘数据中的 LSN;
  • pages flushed up to 是下一次即将做 checkpoint lsn 的位置,如果没有新数据写入则取 lsn 的值
  • last checkpoint at 是上一次检查点所在位置的 LSN。

当我们执行一条修改语句时,InnoDB 存储引擎的执行过程大概如下:

  1. 首先修改内存中的数据页,并在数据页中记录 LSN
  2. 修改数据页的同时向 redo log in buffer 中写入 redo log,并记录下 LSN
  3. 写完 buffer 中的日志之后,当触发了日志刷盘的几种规则时,会向 redo log file on disk 刷入 redo 日志,并在该文件中记录下对应的 LSN
  4. 数据页不可能永远只停留在内存中,在某些情况下,会触发 checkpoint来 将内存中的脏页(数据脏页和日志脏页)刷到磁盘,所以会在本次 **checkpoint 脏页刷盘结束时,在 redo log 中记录 checkpoint 的 LSN 位置。**在 Checkpoint 完成之后,checkpoint LSN 之前的 Redo Log 就不再需要了
  5. 要刷入所有的数据页需要一定的时间来完成,中途刷入的每个数据页都会记下当前页所在的 LSN。

MySQL之深入InnoDB存储引擎——Checkpoint机制,InnoDB存储引擎,MySQL,mysql,数据库,InnoDB

MySQL 在崩溃恢复时,会从重做日志 redo-log 的 Checkpoint 处开始执行重放操作。 它从 last Checkpoint 对应的 LSN 开始扫描 redo-log 日志,并将其应用到 buffer-pool 中,直到 last Checkpoint 对应的 LSN 等于 log flushed up to 对应的 LSN (也就是 redo-log 磁盘上存储的 LSN 值),则恢复完成 。

三、触发时机

Checkpoint 所做的事情无外乎是将缓冲池中的脏页刷回到磁盘,不同之处在于每次刷新多少页到磁盘,每次从哪里获取脏页,以及什么时间触发 Checkpoint。在 InnoDB 内部有两种 Checkpoint,分别为:

  • Sharp Checkpoint
  • Fuzzy Checkpoint

Sharp Checkpoint 发送在数据库关闭时将所有的脏页都刷新回磁盘,这是默认的工作方式,即参数 innodb_fast_shutdown=1。

但是若数据库在运行时也使用 Sharp Checkpoint,那么数据库的可用性就会受到很大影响。所以 InnoDB 存储引擎内部使用 Fuzzy Checkpoint 进行页的刷新,即每次只刷新一部分脏页

InnoDB 存储引擎中可能发生时会触发 Fuzzy Checkpoint:

  • Master Thread Checkpoint:Master Thread 差不多以每秒或每十秒的速度从缓冲池的脏页列表中刷新一定比例的页回磁盘,这个过程是异步的,不会阻塞其他操作。

  • FLUSH_LRU_LIST Checkpoint:Buffer Pool 的 LRU 列表需要保留一定数量的空闲页面,来保证 Buffer Pool 中有足够的空间应对新的数据库请求。在空闲列表不足时,移除LRU列表尾端的页,若移除的页为脏页,则需要进行 Checkpoint。空闲数量阈值是可以配置的(默认是1024),这个检查在一个单独的 Page Cleaner 线程中进行。

  • Async/Sync Flush Checkpoint:当重做日志不可用(即 redo log 写满)时,需要强制将一些页刷新回磁盘,此时脏页从脏页列表中获取。

    • 定义 checkpoint_age = redo_log_in_buffer_lsn - checkpoint_lsn,即有多少脏页还未刷回磁盘
    • 定义 async_water_mark = 0.75 * total_redo_log_file_size,sync_water_mark = 0.9 * total_redo_log_file_size
    • 如果 checkpoint_age < async_water_mark,那么不需要刷新任何脏页回磁盘
    • 如果 async_water_mark < checkpoint_age < sync_water_mark,那么触发 Async Flush,从 Flush 列表刷新足够的脏页回磁盘,以满足checkpoint_age < async_water_mark
    • 如果 checkpoint_age > sync_water(种情况一般很少见,除非设置的重做日志文件太小),那么触发 Sync Flush,从 Flush 列表刷新足够的脏页回磁盘,以满足checkpoint_age < async_water_mark
    • 旧版本中 Async Flush 会阻塞发现问题的用户查询线程,Sync Flush 会阻塞所有查询线程,新版本中在独立的 Page Cleaner Thread 中执行,不会阻塞
  • Dirty Page too much Checkpoint:当脏页数量太多时会强制推进 Checkpoint,以保证缓冲区有足够的空闲页。innodb_max_dirty_pages_pct 的默认值为75,表示当缓冲池脏页比例达到该值时,就会强制进行 Checkpoint,刷新一部分脏页到磁盘。

参考资料

LSN、Checkpoint?MySQL的崩溃恢复是怎么做的? - 脉脉 (maimai.cn)

MySQL 引擎特性 · InnoDB LSN 详解 (log sequence number) - 知乎 (zhihu.com)

谈谈MySQL的WAL、LSN、checkpoint - 知乎 (zhihu.com)文章来源地址https://www.toymoban.com/news/detail-610627.html

到了这里,关于MySQL之深入InnoDB存储引擎——Checkpoint机制的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • MySQL架构 & InnoDB存储引擎

    我们在开发的时候,我们都需要对业务数据进行存储,这个时候,你们就会用到MySQL 、O racal 等数据库。 MySQL它是一个关系型数据库, 这种关系型数据库就有Oracal 、 MySQL,以及最近很火的PgSQL 等。 那什么是关系型数据库呢? 就是它是 基于我们的SQL语句去执行操作的 。 其实

    2024年02月07日
    浏览(55)
  • 谈谈MySQL的InnoDB存储引擎

    大家好,我是易安! 今天我们谈一谈MySQL中InnoDB存储引擎。InnoDB存储引擎作为我们最常用到的存储引擎之一,充分熟悉它的的实现和运行原理,有助于我们更好地创建和维护数据库表。 InnoDB主要包括了内存池、后台线程以及存储文件。内存池又是由多个内存块组成的,主要包

    2024年02月03日
    浏览(43)
  • MySQL 的 InnoDB 存储引擎简介

    MySQL 是世界上最流行的开源关系型数据库管理系统之一,而其中的存储引擎则是其关键组成部分之一。InnoDB 存储引擎在 MySQL 中扮演了重要角色,提供了许多高级功能和性能优化,适用于各种应用程序和工作负载。本文将深入介绍 InnoDB 存储引擎的各个方面,以帮助您更好地理

    2024年02月08日
    浏览(49)
  • MySQL高级10-InnoDB引擎存储架构

    表空间(Tablespace):一个mysql实例,及一个数据库实例,可以对应多个表空间(ibd文件),用于存储记录,索引等数据。 段(Segment):分为数据段(Leaf node segment)、索引段(Non-leaf node segment)、回滚段(Rollback segment),InnoDB是索引组织表,数据段就是B+树的叶子节点(Leaf node segment),

    2024年02月08日
    浏览(46)
  • mysql--InnoDB存储引擎--架构和事务

    MySQL进阶篇 InnoDB 逻辑存储单元主层级关系图: 1、表空间 表空间是InnoDB存储引擎逻辑结构的最高层, 如果用户启用了参数 innodb_file_per_table(在 8.0版本中默认开启) ,则每张表都会有一个表空间(xxx.ibd),一个mysql实例可以对应多个表空间,用于存储记录、索引等数据。 2、段

    2024年02月14日
    浏览(48)
  • 【MYSQL】存储引擎MyISAM和InnoDB

    查看MySQL提供所有的存储引擎 mysql show engines; mysql常用引擎包括:MYISAM、Innodb、Memory、MERGE 1、MYISAM:全表锁,拥有较高的执行速度,不支持事务,不支持外键,并发性能差,占用空间相对较小,对事务完整性没有要求,以select、insert为主的应用基本上可以使用这引擎 2、Innod

    2024年01月18日
    浏览(43)
  • MySQL存储引擎InnoDB和MyISAM的区别?

    InnoDB和MyISAM是MySQL数据库两种常见的存储引擎,它们在性能、事务支持等方面有一些重要的区别。以下是它们的一些主要区别: 事务支持: InnoDB: 支持事务,具有ACID(原子性、一致性、隔离性、持久性)特性,适用于需要事务支持的应用,如银行、电商等。 MyISAM: 不支持

    2024年02月03日
    浏览(52)
  • MySQL 存储引擎 InnoDB 内存结构之缓冲池

    缓冲池是主存储器中的一个区域,在访问 table 和索引数据时 InnoDB 会对其进行缓存。缓冲池允许直接从内存中访问频繁使用的数据,从而加快处理速度。在专用服务器上,通常将高达 80% 的物理内存分配给缓冲池。 为了高效处理大量读取操作,缓冲池被划分为可以容纳多行

    2024年02月10日
    浏览(42)
  • Innodb底层原理与Mysql日志机制深入剖析

    大体来说,MySQL 可以分为 Server 层和存储引擎层两部分。 主要包括连接器、查询缓存、分析器、优化器、执行器等,涵盖 MySQL 的大多数核心服务功能,以及所有的内置函数(如日期、时间、数学和加密函数等),所有跨存储引擎的功能都在这一层实现,比如存储过程、触发器

    2024年02月21日
    浏览(41)
  • MySQL高级篇(存储引擎InnoDB、MyISAM、Memory)

    目录 1、存储引擎简介 1.1、查询建表语句,默认存储引擎:InnoDB 1.2、查看当前数据库支持的存储引擎 1.3、创建表,并指定存储引擎 2、 存储引擎-InnoDB介绍 2.1、存储引擎特点  3、MyISAM存储引擎  4、Memory存储引擎  5、InnoDB、MyISAM、Memory的区别  6、存储引擎的选择 介绍:In

    2024年04月11日
    浏览(46)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包