读高性能MySQL(第4版)笔记16_复制(上)

这篇具有很好参考价值的文章主要介绍了读高性能MySQL(第4版)笔记16_复制(上)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

读高性能MySQL(第4版)笔记16_复制(上)文章来源地址https://www.toymoban.com/news/detail-710212.html

1. 概述

1.1. 复制解决的基本问题是让一台服务器的数据与其他服务器保持同步

1.2. 在源服务器(source server)上,任何数据修改和数据结构变更的事件(event)都会被写入日志文件中

1.3. 副本服务器从源服务器上的日志文件中读取这些事件并在本地重放执行

1.4. 一个异步处理的过程

1.4.1. 不能保证副本服务器上的数据是最新的

1.4.2. 复制延迟(副本数据和最新数据之间的时间差)也并没有上限

1.5. MySQL复制是其内置的一把“瑞士军刀”

1.6. MySQL的复制基本上是向后兼容的

1.6.1. 新版本的服务器可以作为老版本的服务器的副本

1.6.2. 老版本的服务器作为新版本的服务器的副本通常是不可行的

1.7. 通过复制可以将读操作指向副本来获得更好的读扩展性

1.7.1. 并不适合通过复制来扩展写操作

1.8. 在一主库多副本库的架构中,写操作会被执行多次,这时候整个系统的性能取决于写入最慢的那部分

1.9. 在复制架构中,读取和重放日志事件是解耦的

1.9.1. 允许读取日志和重放日志异步进行

1.9.2. I/O线程和SQL线程都是可以独立运行的

2. 用途

2.1. 数据分发

2.1.1. 不会对带宽造成很大的压力

2.1.2. 基于行的复制会比传统的基于语句的复制模式的带宽压力更大

2.1.3. 如果为了保持很低的复制延迟,最好有一个稳定的、低延迟连接

2.2. 读流量扩展

2.2.1. 可以将读操作分布到多台服务器上,实现对读密集型应用的优化

2.2.2. 对于小规模的应用,可以简单地对机器名做硬编码或使用DNS轮询

2.3. 备份

2.3.1. 一项有助于备份的有价值的技术,但副本不是备份,也不能够取代备份

2.4. 分析与报告

2.4.1. 为报告/分析(在线分析处理,OLAP)查询使用专用的副本是一项很好的策略

2.4.2. 可以很好地隔离此类查询产生的压力,以避免对满足外部客户需求的在线业务产生影响

2.5. 高可用性和故障切换

2.5.1. 有助于避免MySQL成为应用程序中的单点故障

2.5.2. 一个包含复制的设计良好的故障切换系统能够显著地缩短宕机时间

2.6. MySQL升级测试

2.6.1. 先使用一个更高版本的MySQL作为副本,确保查询能够在此副本上按照预期执行,再升级所有的实例

3. 步骤

3.1. 源端把数据更改记录到二进制日志中,称之为“二进制日志事件”(binary log events)

3.2. 副本将源上的日志复制到自己的中继日志中

3.3. 副本读取中继日志中的事件,将其重放到副本数据之上

4. 原理

4.1. 复制格式

4.1.1. 基于语句的

4.1.1.1. 通过记录所有在源端执行的数据变更语句来实现的

4.1.1.2. 简单且紧凑

4.1.1.3. 一条更新了大量数据的SQL语句,在二进制日志中可能仅仅需要几十字节存储

4.1.1.4. “不确定性”的SQL语句问题

4.1.1.4.1. 如果在源和副本上,记录的排序不同,这条SQL语句在源和副本上删除的100条记录就会不同,这将导致数据不一致

4.1.1.5. 除非某些场景下明确需要临时使用基于语句的复制

4.1.2. 基于行的

4.1.2.1. 每条被改变的记录都会作为事件被写入二进制日志

4.1.2.2. 让二进制日志的大小发生巨大的增长

4.1.2.3. 建议坚持使用基于行的复制

4.1.2.3.1. 提供了最安全的数据复制方法

4.1.3. 混合模式

4.1.3.1. the mixed method

4.1.3.2. 事件的写入,默认使用基于语句的格式,仅在需要时才切换到基于行的格式

4.1.3.3. 在写入每个事件时会有很多的判断条件,以确定使用哪种格式,而这也会导致二进制日志中出现不可预测的事件

4.1.3.4. 不使用

4.2. 全局事务标识符

4.2.1. GTID

4.2.2. 使用GTID,源服务器提交的每个事务都被分配一个唯一标识符

4.2.3. 由server_uuid和一个递增的事务编号组成的

4.2.4. 当事务被写入二进制日志时,GTID也随之被写入

4.2.4.1. 当SQL线程提交事务时,它也会将GTID标记为执行完成

4.2.5. GTID解决了运行MySQL复制的一个令人痛苦的问题:处理日志文件和位置

4.2.6. 强烈建议在数据库中启用GTID

4.3. 崩溃后的复制安全

4.3.1. innodb_flush_log_at_trx_commit=1

4.3.1.1. 可以保障每个事务日志都被同步地写到磁盘

4.3.1.2. 这是一个符合ACID要求的配置,将最大限度地保护你的数据

4.3.1.3. 二进制日志事件首先被提交,然后事务将被提交并写入磁盘

4.3.1.4. 此参数设置为1将增加磁盘写入操作的频次,同时确保数据的持久性

4.3.2. sync_binlog=1

4.3.2.1. 控制MySQL将二进制日志数据同步到磁盘的频率

4.3.2.2. 设置为1意味着在每次事务执行的时候都会把二进制日志同步写入磁盘

4.3.2.3. 可以防止在服务器崩溃时丢失事务

4.3.2.4. 会增加磁盘写入量

4.3.3. relay_log_info_repository=TABLE

4.3.3.1. 信息将被转移到MySQL本身的InnoDB表中,允许复制更新同一事务中的事务和中继日志信息

4.3.3.2. 会在一个原子操作中完成,并有助于崩溃恢复

4.3.4. relay_log_recovery=ON

4.3.4.1. 使得副本服务器在检测到崩溃时会丢弃所有本地中继日志,并从源服务器中获取丢失的数据

4.3.4.2. 确保了在崩溃中发生的磁盘上的任何损坏或不完整的中继日志都是可恢复的

4.3.4.3. 不再需要配置sync_relay_log

4.3.4.3.1. 因为在发生崩溃时,中继日志将被删除,也就无须花费额外的操作将它们同步到磁盘

4.4. 延迟复制

4.4.1. 某些副本有一些延迟反而是有好处的

4.4.2. 可以让副本中的数据保持在线并且持续运行,但同时落后于源数据库数小时或者数天

4.4.3. 配置语句是CHANGEREPLICATION SOURCE TO,配置选项为SOURCE_DELAY

4.4.4. 场景

4.4.4.1. 删除了一个表

4.4.4.1.1. 从备份中恢复可能需要几个小时
4.4.4.1.2. 如果使用了延迟复制的副本,则可以找到DROP TABLE语句对应的GTID,使副本服务器的复制运行到表被删除之前的时间点,这会大大减少修复时间

4.5. 多线程复制

4.5.1. 在副本端运行多个SQL线程,从而加快本地中继日志的应用

4.5.2. 两种模式

4.5.2.1. DATABASE模式

4.5.2.1.1. 使用多线程更新不同的数据库
4.5.2.1.2. 但不会有两个线程同时更新同一个数据库
4.5.2.1.3. 将数据分布在MySQL的多个数据库中,则可以同时并且一致地更新它们,这种模式非常有效

4.5.2.2. LOGICAL_CLOCK模式

4.5.2.2.1. 允许对同一个数据库进行并行更新,只要它们都是同一个二进制日志组提交的一部分
4.5.2.2.2. 人工延迟的配置参数
4.5.2.2.2.1. binlog_group_commit_sync_delay(以微秒为单位的延迟)
4.5.2.2.2.2. binlog_group_commit_sync_no_delay_count(决定中止等待之前要等待的事务数)
4.5.2.2.2.3. 确保你的副本配置了参数replica_preserve_commit_order,这样就不会出现无序提交的问题

4.6. 半同步复制

4.6.1. 在启用半同步复制后,源在完成每个事务提交时,都需要确保事务至少被一个副本所接收

4.6.2. 需要确认副本已收到并成功将其写入自己的中继日志(但不一定应用到本地数据)

4.6.3. 如果在一定时间范围内没有副本确认事务,MySQL将恢复到标准的异步复制模式

4.6.4. 半同步复制不是一种防止数据丢失的方法,而是可以让你拥有更具弹性的故障切换的更大工具集的一部分

4.6.5. 建议不要依赖该功能来保证数据完整性

4.7. 复制过滤器

4.7.1. 可以让副本仅复制一部分数据

4.7.2. 复制过滤器是一颗定时炸弹

4.7.3. 从源上的二进制日志中过滤事件

4.7.3.1. binlog_do_db

4.7.3.2. binlog_ignore_db

4.7.3.3. 不仅有可能破坏复制,还会使从备份中进行时间点恢复变得不可能

4.7.3.3.1. 在大多数情况下都不应该使用它们

4.7.4. 从副本上的中继日志中过滤事件

4.7.4.1. replication_*选项在SQL线程从中继日志中读取事件时过滤事件

到了这里,关于读高性能MySQL(第4版)笔记16_复制(上)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 读高性能MySQL(第4版)笔记09_创建高性能索引(下)

    1.4.4.1. InnoDB的二级索引在叶子节点中保存了记录的主键值,所以如果二级索引能够覆盖查询,则可以避免对主键索引的二次查询 7.1.5.1. 常见的类似错误通常是由于尝试使用rsync备份InnoDB导致的 7.3.3.1. 否则,对于范围查询、索引覆盖扫描等操作来说,速度可能会降低很多 7

    2024年02月08日
    浏览(63)
  • 读高性能MySQL(第4版)笔记10_查询性能优化(上)

    4.11.1.1. 在存储引擎层完成的 4.11.2.1. 直接从索引中过滤不需要的记录并返回命中的结 4.11.2.2. 在MySQL服务器层完成的,但无须再回表查询记录 4.11.3.1. 在MySQL服务器层完成 4.11.3.2. 需要先从数据表中读出记录然后过滤 4.13.2.1. 使用单独的汇总表 5.5.1.1. 定期清除大量数据时,

    2024年02月08日
    浏览(61)
  • 读高性能MySQL(第4版)笔记12_查询性能优化(下)

    2.3.1.1. 读取行指针和需要排序的字段,对其进行排序,然后再根据排序结果读取所需要的数据行 2.3.1.2. 即需要从数据表中读取两次数据,第二次读取数据的时候,因为是读取排序列进行排序后的所有记录,这会产生大量的随机I/O,所以两次传输排序的成本非常高 2.3.2.1. 先

    2024年02月08日
    浏览(50)
  • 读高性能MySQL(第4版)笔记18_扩展MySQL

    4.2.2.1. 增加更多应用节点可以扩展服务用户请求的客户端数 4.2.2.2. 最终会被单源数据库主机的能力所限制,该数据库主机将要负责响应所有的读取请求 4.2.2.3. 高CPU使用率意味着服务器正花费所有的时间处理查询 4.2.2.4. CPU的使用率越高,查询的延迟也会越长 6.9.1.1. 负载均

    2024年02月08日
    浏览(53)
  • 读高性能MySQL(第4版)笔记03_监控

    7.1.1.1. 200响应代码 7.1.2.1. 202已接受 10.3.2.1. 连接的线程数(threads_connected)很高,但运行的线程数(threads_running)仍然很低 10.3.3.1. 连接的线程数(threads_connected)和运行的线程数(threads_running)都处于高值并持续增加 10.5.1.1. 数据库工程师不断努力的目标之一

    2024年02月12日
    浏览(38)
  • 读高性能MySQL(第4版)笔记01_MySQL架构(上)

    1.2.2.1. 存储过程 1.2.2.2. 触发器 1.2.2.3. 视图 3.3.2.1. 共享锁(shared lock) 3.3.2.2. 资源上的读锁是共享的,或者说是相互不阻塞的 3.3.3.1. 排他锁(exclusive lock) 3.3.3.2. 写锁则是排他的,也就是说,一个写锁既会阻塞读锁也会阻塞其他的写锁 3.3.3.3. 只有这样才能确保在特定的

    2024年02月13日
    浏览(46)
  • 读高性能MySQL(第4版)笔记02_MySQL架构(下)

    2.6.4.1. 失败的事务可能导致不一致的结果,因为某些部分可以回滚,而其他部分不能回滚 5.1.1.1. 在表的.ibd文件中 5.1.1.2. 减少了I/O,非常高效 5.2.1.1. 分区定义 5.2.1.2. 表定义 5.2.1.3. 存储程序定义 5.2.1.4. 字符集 5.2.1.5. 排序信息 5.2.2.1. 每个表的.ibd和.frm文件被替换为已经

    2024年02月12日
    浏览(56)
  • 读高性能MySQL(第4版)笔记14_备份与恢复(中)

    7.3.6.1. 消除了底层数据存储引擎的差异 7.3.7.1. 如果MySQL在内存中的数据还没有损坏,当不能得到一个正常的裸文件备份时,或许可以得到一个可以信赖的逻辑备份 7.4.1.1. 某些场景下比数据库文件本身更大 7.4.2.1. 浮点表示的问题、软件Bug等都会导致问题 7.4.3.1. MySQL中导出数

    2024年02月08日
    浏览(33)
  • 读高性能MySQL(第4版)笔记13_备份与恢复(上)

    5.3.2.1. 尽可能久地保留多份备份的数据和二进制文件 5.3.2.2. 即使最近的备份无法使用,还可以使用较老的备份来执行恢复或者创建新的副本 6.2.1.1. 在一块不同的磁盘上 6.2.1.2. 一台不同的服务器上 6.2.1.3. 离线存储 11.2.1.1. 不包含数据的完整副本 11.2.2.1. 只包含数据的实时

    2024年02月08日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包