读高性能MySQL（第4版）笔记18_扩展MySQL

10月前作者：躺柒分类：Toy博客阅读(52) 违法举报

这篇具有很好参考价值的文章主要介绍了读高性能MySQL（第4版）笔记18_扩展MySQL。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

读高性能MySQL（第4版）笔记18_扩展MySQL 文章来源地址https://www.toymoban.com/news/detail-711022.html

1. 增长

1.1. 在高速的业务环境中，流量可能逐年增长几个数量级，环境会变得更加复杂，随之而来的数据需求也会快速增加

1.2. 扩展Web服务器

1.2.1. 在负载均衡的后端添加更多的服务器节点，而这通常就是扩展We b服务器的全部工作

2. 可扩展性

2.1. 系统支撑不断增长的流量的能力

2.1.1. 可扩展性就是能够通过增加资源来提升容量的能力

2.2. 一个系统扩展能力的好坏可以用成本和简单性来衡量

2.3. 容量是一个和可扩展性相关的概念

2.3.1. 系统容量表示在一定时间内能够完成的工作量

2.3.2. 容量可以简单地被认为是处理负载的能力，从几个不同的角度来考虑负载很有帮助

2.4. 系统的最大吞吐量并不等同于容量

2.4.1. 如果达到最大吞吐量，则性能会下降，响应时间会变得不可接受且非常不稳定

2.5. 即使系统性能不是很高也可以具备可扩展性

2.6. 数据量

2.6.1. 应用所能累积的大量数据是可扩展性最普遍的一个挑战

2.6.2. 应用从不删除任何数据

2.7. 用户数

2.7.1. 当查询依赖于用户间的关系时（关系的数量可以用N*（N-1）/2来计算，这里N表示用户数

2.8. 用户活跃度

2.8.1. 不是所有的用户的活跃度都相同，并且用户活跃度也不总是不变的

2.9. 相关数据集的大小

2.9.1. 社交网站经常会面临由那些人气很旺的用户组或朋友很多的用户所带来的挑战

2.10. 可扩展性的原则之一是避免节点之间的交叉访问

2.11. 请专注于确定业务是读限制的还是写限制的

3. 扩展MySQL的理论思想

3.1. 优先使用更小的实例

3.1.1. 按功能、水平方式或两者兼而有之来分割数据

3.1.2. 当故障发生时，实例越小，所造成的影响面也越小

3.2. 通过复制和自动写故障切换来增强弹性

3.2.1. 在发生故障时，自动进行写入故障切换，并管理拓扑更改和对数据库节点的应用程序访问，以使写停机时间尽可能短

3.3. 通过半同步复制保证持久性

3.3.1. 相对于默认的异步复制

4. 读限制与写限制工作负载

4.1. 工作负载

4.1.1. 系统能达到的QPS数

4.1.2. 是所有类型的查询及其延迟的混合

4.2. 读限制工作负载

4.2.1. 读限制工作负载是指读取（SELECT）总流量超过服务器容量的工作负载

4.2.2. 单源主机

4.2.2.1. 增加更多应用节点可以扩展服务用户请求的客户端数

4.2.2.2. 最终会被单源数据库主机的能力所限制，该数据库主机将要负责响应所有的读取请求

4.2.2.3. 高CPU使用率意味着服务器正花费所有的时间处理查询

4.2.2.4. CPU的使用率越高，查询的延迟也会越长

4.2.3. 引入副本来扩展读流量

4.3. 写限制工作负载

4.3.1. 写限制工作负载则超过了服务器提供DML（INSERT、UPDATE、DELETE）操作的容量

4.3.2. 当写入量成为瓶颈时，必须开始考虑使用拆分数据的方法，以便在单独的子数据集上接受并行的写入

4.3.3. 仔细检查schema，确定是否存在读需求增长比其他写需求增长更快的表数据子集

5. 功能拆分

5.1. 基于业务中的“功能”来拆分数据是一项和业务背景强相关的任务，需要深入了解数据的用途

5.2. 指导原则

5.2.1. 不要根据工程团队的组织架构进行拆分，它会经常变动

5.2.2. 根据业务功能来拆分表

5.2.3. 不要回避处理数据中混杂了不同业务关系的问题，你不仅需要倡导数据分离，还需要倡导应用程序重构，并需要引入API来实现相互跨界的访问

6. 用读池扩展读

6.1. 集群中的副本可用于多个目的

6.1.1. 副本是故障切换的候选对象

6.2. 并非所有的复制副本都在池中，这是一种防止不同的读取工作负载相互影响的常见方法

6.3. 使用读池时会有不止一台服务读请求的数据库主机

6.4. 管理这些读池的一种非常常见的方法是使用负载均衡器来提供虚拟IP

6.4.1. 该IP充当所有要访问读副本的流量的中介

6.4.2. 技术包括HAProxy、自用主机时的硬件负载均衡器，或在公共云环境中运行时的网络负载均衡器

6.5. 在MySQL中，建议使用leastconn实现池节点之间的平衡

6.6. 服务发现是一个很好的选择，它可以自动发现新的主机并将其加入池列表

6.7. 每个副本池至少还要有三个节点服务于特定应用

6.8. 读池健康检查

6.9. 选择负载均衡器算法

6.9.1. 随机

6.9.1.1. 负载均衡器将每个请求定向到从可用服务器池中随机选择的服务器

6.9.2. 轮询

6.9.2.1. 负载均衡器以重复的顺序向服务器发送请求

6.9.3. 最少连接

6.9.3.1. 下一个连接指向拥有最少活跃连接的服务器

6.9.4. 最快响应

6.9.4.1. 处理请求最快的服务器接收下一个连接

6.9.5. 哈希

6.9.5.1. 负载均衡器对连接的源IP地址进行哈希处理，这会将地址映射到池中的一台服务器

6.9.6. 权重

6.9.6.1. 负载均衡器可以组合几种算法并添加权重

6.9.7. MySQL的最佳算法取决于具体工作负载

6.9.7.1. 一定要考虑在特殊情况下和日常情况下会发生什么

7. 排队机制

7.1. 使用设计上倾向于一致性而不是可用性的数据存储来扩展写事务时，扩展应用程序层会变得复杂得多

8. 使用分片扩展写

8.1. 分片意味着将数据切分成不同的、更小的数据库集群

8.1.1. 可以同时在更多的源主机上执行更多的写入操作

8.2. 功能分割（Functional partitioning）

8.2.1. 职责划分

8.2.2. 将不同的节点用于不同的任务

8.3. 数据分片（Data sharding）

8.3.1. 当今扩展超大型MySQL应用程序最常见和最成功的方法

8.4. 只对需要分片的数据进行切分

8.4.1. 通常是数据集中增长非常大的部分

8.5. 切分方案

8.5.1. 目标是使最重要和最频繁的查询接触到尽可能少的分片

8.6. 多个分片键

8.6.1. 复杂的数据模型使数据分片更加困难

8.7. 跨分片查询

8.7.1. 主动缓存通常也是有必要的

8.7.2. 设计间歇性运行的清理程序

8.8. Vitess

8.8.1. Vitess是面向MySQL的一个数据库集群系统

8.8.2. 一个用于运行数据库层的稳定平台，而不是一个临时的解决方案

8.8.3. 测试并记录向整个系统引入的延迟

8.8.4. 使用金丝雀部署模型

8.8.5. 特性

8.8.5.1. 支持水平分片，包括数据分片

8.8.5.2. 拓扑结构管理

8.8.5.3. 源节点故障切换管理

8.8.5.4. schema变更管理

8.8.5.5. 连接池

8.8.5.6. 查询重写

8.8.6. 组件

8.8.6.1. Vitess pod

8.8.6.1.1. 对一组数据库和Vitess相关部件的通用封装

8.8.6.2. VTGate

8.8.6.2.1. 为应用程序与操作员控制数据库实例访问提供的服务

8.8.6.3. VTTablet

8.8.6.3.1. 在Vitess管理的每个数据库实例上运行的代理

8.8.6.4. Topology

8.8.6.4.1. 在给定的pod中保存由Vitess管理的数据库实例清单以及相应的信息

8.8.6.4.2. 元数据存储

8.8.6.5. vtctl

8.8.6.5.1. 对Vitess pod进行操作更改的命令行工具

8.8.6.6. vtctld

8.8.6.6.1. 用来进行相同管理操作的图形化界面

8.9. ProxySQL

8.9.1. René Cannaò

8.9.1.1. MySQL的长期贡献者

8.9.2. 专门为MySQL协议编写的，通过通用公共许可证（GPL）发布

8.9.3. 提供了一个易于部署的抽象，比HAProxy更复杂，但在基础设施和复杂性方面的前期投入较少

8.9.4. 可以使用ProxySQL作为任何应用程序代码和MySQL实例的中间层

8.9.5. 一个很好的轻量级中间层，而且是分片感知的，还可以相应地路由应用程序连接

8.9.6. 按用户分片

8.9.7. 按schema分片

到了这里，关于读高性能MySQL（第4版）笔记18_扩展MySQL的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

读高性能MySQL（第4版）笔记12_查询性能优化（下）

2.3.1.1. 读取行指针和需要排序的字段，对其进行排序，然后再根据排序结果读取所需要的数据行 2.3.1.2. 即需要从数据表中读取两次数据，第二次读取数据的时候，因为是读取排序列进行排序后的所有记录，这会产生大量的随机I/O，所以两次传输排序的成本非常高 2.3.2.1. 先

2024年02月08日
浏览(49)
读高性能MySQL（第4版）笔记11_查询性能优化（中）

2024年02月08日
浏览(58)
读高性能MySQL（第4版）笔记10_查询性能优化（上）

4.11.1.1. 在存储引擎层完成的 4.11.2.1. 直接从索引中过滤不需要的记录并返回命中的结 4.11.2.2. 在MySQL服务器层完成的，但无须再回表查询记录 4.11.3.1. 在MySQL服务器层完成 4.11.3.2. 需要先从数据表中读出记录然后过滤 4.13.2.1. 使用单独的汇总表 5.5.1.1. 定期清除大量数据时，

2024年02月08日
浏览(61)
读高性能MySQL（第4版）笔记03_监控

7.1.1.1. 200响应代码 7.1.2.1. 202已接受 10.3.2.1. 连接的线程数（threads_connected）很高，但运行的线程数（threads_running）仍然很低 10.3.3.1. 连接的线程数（threads_connected）和运行的线程数（threads_running）都处于高值并持续增加 10.5.1.1. 数据库工程师不断努力的目标之一

2024年02月12日
浏览(37)
读高性能MySQL（第4版）笔记01_MySQL架构（上）

1.2.2.1. 存储过程 1.2.2.2. 触发器 1.2.2.3. 视图 3.3.2.1. 共享锁（shared lock） 3.3.2.2. 资源上的读锁是共享的，或者说是相互不阻塞的 3.3.3.1. 排他锁（exclusive lock） 3.3.3.2. 写锁则是排他的，也就是说，一个写锁既会阻塞读锁也会阻塞其他的写锁 3.3.3.3. 只有这样才能确保在特定的

2024年02月13日
浏览(45)
读高性能MySQL（第4版）笔记02_MySQL架构（下）

2.6.4.1. 失败的事务可能导致不一致的结果，因为某些部分可以回滚，而其他部分不能回滚 5.1.1.1. 在表的.ibd文件中 5.1.1.2. 减少了I/O，非常高效 5.2.1.1. 分区定义 5.2.1.2. 表定义 5.2.1.3. 存储程序定义 5.2.1.4. 字符集 5.2.1.5. 排序信息 5.2.2.1. 每个表的.ibd和.frm文件被替换为已经

2024年02月12日
浏览(55)
读高性能MySQL（第4版）笔记17_复制（下）

1.3.1.1. 安全补丁 1.3.1.2. 内核更新 1.3.1.3. 一些配置选项更改后需要重新启动才能生效 1.3.2.1. 确定将哪个副本切换为新的源 1.3.2.1.1. 一个包含所有数据的副本 1.3.2.2. 检查延时，确保延时在秒级别 1.3.2.3. 通过设置super_read_only停止数据写入源服务器 1.3.2.4. 等待副本与目标完

2024年02月08日
浏览(47)
读高性能MySQL（第4版）笔记16_复制（上）

4.1.1.1. 通过记录所有在源端执行的数据变更语句来实现的 4.1.1.2. 简单且紧凑 4.1.1.3. 一条更新了大量数据的SQL语句，在二进制日志中可能仅仅需要几十字节存储 4.1.1.4. “不确定性”的SQL语句问题 4.1.1.4.1. 如果在源和副本上，记录的排序不同，这条SQL语句在源和副本上删除

2024年02月08日
浏览(40)
读高性能MySQL（第4版）笔记14_备份与恢复（中）

7.3.6.1. 消除了底层数据存储引擎的差异 7.3.7.1. 如果MySQL在内存中的数据还没有损坏，当不能得到一个正常的裸文件备份时，或许可以得到一个可以信赖的逻辑备份 7.4.1.1. 某些场景下比数据库文件本身更大 7.4.2.1. 浮点表示的问题、软件Bug等都会导致问题 7.4.3.1. MySQL中导出数

2024年02月08日
浏览(33)
读高性能MySQL（第4版）笔记13_备份与恢复（上）

5.3.2.1. 尽可能久地保留多份备份的数据和二进制文件 5.3.2.2. 即使最近的备份无法使用，还可以使用较老的备份来执行恢复或者创建新的副本 6.2.1.1. 在一块不同的磁盘上 6.2.1.2. 一台不同的服务器上 6.2.1.3. 离线存储 11.2.1.1. 不包含数据的完整副本 11.2.2.1. 只包含数据的实时

2024年02月08日
浏览(37)