读高性能MySQL(第4版)笔记13_备份与恢复(上)

这篇具有很好参考价值的文章主要介绍了读高性能MySQL(第4版)笔记13_备份与恢复(上)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

读高性能MySQL(第4版)笔记13_备份与恢复(上)文章来源地址https://www.toymoban.com/news/detail-710026.html

1. 每个人都知道需要备份,但并不是每个人都能意识到需要的是可恢复的备份

1.1. 如果你没有提前做好备份规划,也许以后会发现已经错失了一些最佳的选择

1.2. 在服务器已经配置好以后,才想起应该使用LVM,以便获取文件系统的快照——但这时已经太迟了

1.3. 如果你没有计划做定期的恢复演练,当真的需要恢复时,就会发现并没有那么顺利

2. 不要掉进副本就是备份的陷阱

2.1. 副本对生成备份而言是一个干涉较少的源,但它不是备份本身

2.2. 确保备份可以通过DROP TABLE测试

2.2.1. “遭受黑客攻击”的测试

2.2.2. 能通过数据中心失败的测试

2.2.3. 如果是基于备库生成备份,需要通过从源重建备份,并从那时起强制执行super_read_only来确保你的所有副本是一致的

3. 裸文件备份

3.1. 物理备份

3.2. 文件系统中的文件副本

4. 逻辑备份

4.1. 重建数据所需的SQL语句

5. 推荐的备份方式

5.1. Percona XtraBackup进行裸文件备份

5.2. mydumper进行逻辑备份

5.3. 无侵入地实现二进制的原始数据备份

5.3.1. 备份可以通过启动mysqld实例检查所有的表来进行验证

5.3.2. 建议备份二进制日志

5.3.2.1. 尽可能久地保留多份备份的数据和二进制文件

5.3.2.2. 即使最近的备份无法使用,还可以使用较老的备份来执行恢复或者创建新的副本

6. 整体备份和恢复策略要点

6.1. 安全

6.1.1. 访问备份的入口

6.1.2. 恢复数据的权限

6.1.3. 文件是否需要加密

6.2. 备份存储在哪里

6.2.1. 离源数据多远

6.2.1.1. 在一块不同的磁盘上

6.2.1.2. 一台不同的服务器上

6.2.1.3. 离线存储

6.2.2. 如何将数据从源头移动到目的地

6.3. 保留策略、审计、法律要求,以及相关的条款

6.4. 存储解决方案和介质,压缩,以及增量备份

6.5. 存储的格式

6.6. 对备份的监控和报告

6.7. 存储层内置备份功能

6.7.1. 其他专用设备

7. 热备份

7.1. 不需要任何的服务停机时间

8. 还原

8.1. 从备份文件中获取数据,可以将这些文件加载到MySQL里,也可以将这些文件放置到MySQL期望的路径中

9. 恢复

9.1. 当某些异常发生后对一个系统或其部分的拯救

9.2. 从备份中还原数据

9.3. 使服务器完全恢复功能的所有必要步骤

9.4. 存储引擎的崩溃恢复要求数据和日志文件一致

9.4.1. 要确保数据文件中只包含已经提交的事务所做的修改,恢复操作会将日志中还没有应用到数据文件的事务重新执行

10. 备份的理由

10.1. 灾难恢复

10.1.1. 硬件故障

10.1.2. 一个不经意的Bug导致数据损坏

10.1.3. 服务器及其数据由于某些原因不可获取或无法使用

10.1.4. 某人偶然连错服务器执行了一个ALTER TABLE操作

10.1.5. 机房大楼被烧毁

10.1.6. 恶意的黑客攻击

10.2. 人们改变想法

10.2.1. 经常会在删除某些数据后又想恢复这些数据

10.3. 审计

10.3.1. 需要知道数据或Schema在过去的某个时间点是什么样的

10.4. 测试

10.4.1. 最简单的基于实际数据来测试的方法是,定期用最新的生产环境数据更新测试服务器

10.4.2. 只要把备份文件还原到测试服务器上即可

11. 备份误区

11.1. 复制就是备份

11.1.1. 复制不是备份

11.1.2. 使用RAID阵列也不是备份

11.1.3. 不是备份,也不是备份的替代品

11.2. 快照就是备份

11.2.1. 无论是LVM、ZFS还是SAN快照,都不是真正的备份

11.2.1.1. 不包含数据的完整副本

11.2.2. 快照是写时复制

11.2.2.1. 只包含数据的实时副本与快照发生时的数据之间的差异

11.2.3. 如果备份是用于某些特殊用户的,那么快照可能是一个非常好的方法

12. 定义恢复需求

12.1. 备份在先

12.1.1. 只有已经做了备份才可能恢复,因此在构建系统时,注意力自然会集中在备份上

12.2. 备份由脚本和任务自动完成

12.3. 备份是日常任务,但恢复常常发生在危急情形下

12.4. 安全的需要

12.4.1. 做异地备份,可能需要对备份数据进行加密,或采取其他措施来进行保护

12.5. 需要培养几个人并有计划地让他们互为备份,这样就无须由一个不合格的人来恢复数据

12.6. 恢复点目标(PRO)

12.7. 恢复时间目标(RTO)

13. 备份方案

13.1. 备份仅是数据的一个副本,但是受限于应用程序的要求、MySQL的存储引擎架构,以及系统配置等因素,复制一份数据变得很困难

13.2. 对数据丢失的承受力越强,备份越简单

13.2.1. 一个“宽松”的基于故障时间点的恢复需求意味着需要重建数据,直到“足够接近”问题发生的时刻

13.2.2. 一个“硬性”的需求意味着不能容忍丢失任何一个已提交的事务,即使某些可怕的事情发生(例如,服务器着火了)

13.2.2.1. 将二进制日志保存在一个独立的SAN卷

13.2.2.2. 使用DRBD磁盘复制

13.3. 在生产实践中,对于大数据库来说,裸文件备份是必需的:逻辑备份太慢并受到资源限制,从逻辑备份中恢复需要很长时间

13.3.1. 基于快照的备份,例如Percona   XtraBackup和MySQL  EnterpriseBackup,是最好的选择

13.3.2. 对于较小的数据库,逻辑备份可以很好地胜任

13.4. 保留多个备份集

13.5. 定期从逻辑备份(或者裸文件备份)中抽取数据进行恢复测试

13.6. 保存二进制日志用于基于故障时间点的恢复

13.6.1. 将expire_logs_days参数的值设置得足够大,至少确保可以从最近两次裸文件备份中做基于时间点的恢复

13.6.2. 保持源运行且不应用任何二进制日志的情况下创建一个副本

13.6.3. 使备份二进制日志独立于过期设置,二进制日志需要保存在备份中足够长的时间,以便能从最近的逻辑备份中进行恢复

13.6.4. 重放二进制日志来恢复到想要的时间点

13.7. 完全不借助备份工具本身来监控备份和备份的过程

13.7.1. 需要额外验证备份是否正常

13.8. 通过演练整个恢复过程来测试备份和恢复

13.8.1. 测算恢复所需要的资源(CPU、磁盘空间、实际时间,以及网络带宽等)

13.9. 考虑安全性

到了这里,关于读高性能MySQL(第4版)笔记13_备份与恢复(上)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 读高性能MySQL(第4版)笔记09_创建高性能索引(下)

    1.4.4.1. InnoDB的二级索引在叶子节点中保存了记录的主键值,所以如果二级索引能够覆盖查询,则可以避免对主键索引的二次查询 7.1.5.1. 常见的类似错误通常是由于尝试使用rsync备份InnoDB导致的 7.3.3.1. 否则,对于范围查询、索引覆盖扫描等操作来说,速度可能会降低很多 7

    2024年02月08日
    浏览(63)
  • 读高性能MySQL(第4版)笔记10_查询性能优化(上)

    4.11.1.1. 在存储引擎层完成的 4.11.2.1. 直接从索引中过滤不需要的记录并返回命中的结 4.11.2.2. 在MySQL服务器层完成的,但无须再回表查询记录 4.11.3.1. 在MySQL服务器层完成 4.11.3.2. 需要先从数据表中读出记录然后过滤 4.13.2.1. 使用单独的汇总表 5.5.1.1. 定期清除大量数据时,

    2024年02月08日
    浏览(61)
  • 读高性能MySQL(第4版)笔记12_查询性能优化(下)

    2.3.1.1. 读取行指针和需要排序的字段,对其进行排序,然后再根据排序结果读取所需要的数据行 2.3.1.2. 即需要从数据表中读取两次数据,第二次读取数据的时候,因为是读取排序列进行排序后的所有记录,这会产生大量的随机I/O,所以两次传输排序的成本非常高 2.3.2.1. 先

    2024年02月08日
    浏览(50)
  • 读高性能MySQL(第4版)笔记18_扩展MySQL

    4.2.2.1. 增加更多应用节点可以扩展服务用户请求的客户端数 4.2.2.2. 最终会被单源数据库主机的能力所限制,该数据库主机将要负责响应所有的读取请求 4.2.2.3. 高CPU使用率意味着服务器正花费所有的时间处理查询 4.2.2.4. CPU的使用率越高,查询的延迟也会越长 6.9.1.1. 负载均

    2024年02月08日
    浏览(53)
  • 读高性能MySQL(第4版)笔记03_监控

    7.1.1.1. 200响应代码 7.1.2.1. 202已接受 10.3.2.1. 连接的线程数(threads_connected)很高,但运行的线程数(threads_running)仍然很低 10.3.3.1. 连接的线程数(threads_connected)和运行的线程数(threads_running)都处于高值并持续增加 10.5.1.1. 数据库工程师不断努力的目标之一

    2024年02月12日
    浏览(38)
  • 读高性能MySQL(第4版)笔记01_MySQL架构(上)

    1.2.2.1. 存储过程 1.2.2.2. 触发器 1.2.2.3. 视图 3.3.2.1. 共享锁(shared lock) 3.3.2.2. 资源上的读锁是共享的,或者说是相互不阻塞的 3.3.3.1. 排他锁(exclusive lock) 3.3.3.2. 写锁则是排他的,也就是说,一个写锁既会阻塞读锁也会阻塞其他的写锁 3.3.3.3. 只有这样才能确保在特定的

    2024年02月13日
    浏览(46)
  • 读高性能MySQL(第4版)笔记02_MySQL架构(下)

    2.6.4.1. 失败的事务可能导致不一致的结果,因为某些部分可以回滚,而其他部分不能回滚 5.1.1.1. 在表的.ibd文件中 5.1.1.2. 减少了I/O,非常高效 5.2.1.1. 分区定义 5.2.1.2. 表定义 5.2.1.3. 存储程序定义 5.2.1.4. 字符集 5.2.1.5. 排序信息 5.2.2.1. 每个表的.ibd和.frm文件被替换为已经

    2024年02月12日
    浏览(56)
  • 读高性能MySQL(第4版)笔记17_复制(下)

    1.3.1.1. 安全补丁 1.3.1.2. 内核更新 1.3.1.3. 一些配置选项更改后需要重新启动才能生效 1.3.2.1. 确定将哪个副本切换为新的源 1.3.2.1.1. 一个包含所有数据的副本 1.3.2.2. 检查延时,确保延时在秒级别 1.3.2.3. 通过设置super_read_only停止数据写入源服务器 1.3.2.4. 等待副本与目标完

    2024年02月08日
    浏览(48)
  • 读高性能MySQL(第4版)笔记16_复制(上)

    4.1.1.1. 通过记录所有在源端执行的数据变更语句来实现的 4.1.1.2. 简单且紧凑 4.1.1.3. 一条更新了大量数据的SQL语句,在二进制日志中可能仅仅需要几十字节存储 4.1.1.4. “不确定性”的SQL语句问题 4.1.1.4.1. 如果在源和副本上,记录的排序不同,这条SQL语句在源和副本上删除

    2024年02月08日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包