读发布！设计与部署稳定的分布式系统（第2版）笔记30_为部署而设计

9月前作者：躺柒分类：Toy博客阅读(29) 违法举报

这篇具有很好参考价值的文章主要介绍了读发布！设计与部署稳定的分布式系统（第2版）笔记30_为部署而设计。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

读发布！设计与部署稳定的分布式系统（第2版）笔记30_为部署而设计文章来源地址https://www.toymoban.com/news/detail-644133.html

1. 部署行为是系统生命的重要组成部分

1.1. 只编写代码是不够的，只要没有在生产环境中运行，一切都不算完成

1.2. 要想取得成功，需要早早地频繁部署软件

1.3. 设计易于部署的软件非常有必要

1.4. 零停机部署就是目标

2. 机器与服务

2.1. 机器是可配置的操作系统实例

2.1.1. 如果系统在真正的机器上运行，那么这就意味着物理主机

2.1.2. 如果系统在虚拟机、容器或unikernel上运行，那么这些就是单元

2.2. 服务是供其他系统使用的可调用接口

2.2.1. 由在多台机器上运行的软件的冗余副本组成

2.3. 我们的环境拥有比以往更多的机器，而且大部分都是虚拟的

2.4. 有些机器是其他机器创建的，所以运维人员从未接触

3. 计划停机时间的谬误

3.1. 不能计划一次或几次就完成部署，而应该每次一点逐步叠加地进行多次部署

3.2. 更新系统的过程需要花费时间

3.3. 要将部署视为软件的一个特性

3.3.1. 不能只为了最终状态而编写代码，然后将代码交给运维部门，让他们搞清如何在生产环境中运行这些程序

4. 自动化部署

4.1. 构建流水线

4.1.1. 将代码变更提交到版本控制系统后，构建流水线就会启动

4.1.2. 产品

4.1.2.1. Jenkins可能是如今最常用的工具

4.1.2.2. ThoughtWorks的GoCD

4.1.2.3. Netflix公司的Spinnaker

4.1.2.4. 亚马逊的AWS Code Pipeline

4.2. 不要试图去找最好的工具，而应该选择一个足够满足需要的，然后好好加以利用

4.3. 由于服务可以在具有不同IP地址的任意数量的不同机器上运行，因此平台还必须配置网络，实现负载均衡和流量路由

4.4. 如果使用不可变的基础设施，那么一般从基本的操作系统镜像开始部署

4.4.1. 此时并不是试图从未知状态收敛到预期状态

4.4.2. 始终从已知状态——主操作系统镜像——开始

4.5. 不可变的基础设施与IaaS、PaaS以及自动化映射是高度一致的

4.6. 状态收敛在物理机器部署、长寿命虚拟机器和手动映射中则更为常见

5. 持续部署

5.1. 未部署的代码

5.1.1. 未完成的库存

5.1.2. 有着未知的缺陷

5.1.3. 会令容量扩展失效

5.1.4. 会导致生产环境出问题

5.1.5. 也可能很好地实现一个没人想要的功能

5.2. 从开发人员向代码库提交代码到代码最终在生产环境中运行，这段时间的代码最为棘手

5.2.1. 持续部署就是尽可能地缩短上述时间段，尽可能地减少未部署代码引发的问题

5.3. 持续不间断地部署所有代码

5.3.1. 意味着每次提交代码，都要运行完整的构建流水线

5.4. 如果放慢软件发布进度耗费的成本，超过部署软件中弥补错误需要的成本，那么通过流水线自动将代码部署到生产环境更合适

5.5. 由代码错误造成的成本，可能会远远大于在竞争中较慢地发布软件的成本，此时在部署到生产环境之前进行人工检查更为合理

5.5.1. 要确保掌管授权按钮的人能随时待命

6. 部署中的各个阶段

6.1. 部署PHP应用程序，就是简单地把文件复制到生产主机上，然后下一个访问该主机的请求就会访问这些新文件

6.1.1. 当请求访问尚未完成复制的文件时，该如何处理

6.2. 相比复制软件包文件并重新启动应用程序容器，复制没有运行时进程的单个文件速度更快

6.3. 粒度越大，安装和激活软件所需的时间就越长

6.4. 微观时间尺度适用于单个实例（主机、虚拟机或容器）

6.5. 宏观时间尺度适用于这个版本的整体推送

6.6. 对于可变的基础设施，这意味着将文件复制到位，从而能够快速更新符号链接或目录引用

6.7. 对于不可变的基础设施，这就是部署新镜像所需的时间

6.8. 会话可以保持活动的时间长度可以没有上限，特别是当你无法区分访问者是人类还是机器人或网络爬虫的时候，尤其如此

6.9. 一旦将部署视为一段时间内的工作，就可以让应用程序协助完成自身的部署

7. 关系数据库模式

7.1. 完全安全的数据库模式的变更是

7.1.1. 添加一个表格

7.1.2. 添加视图

7.1.3. 在表中添加一个可空列

7.1.4. 添加别名或同义词

7.1.5. 添加新的存储过程

7.1.6. 添加触发器

7.1.7. 将现有数据复制到新的表格或列中

7.1.8. 数据库模式变更的扩充阶段

7.1.8.1. 当前应用程序不会使用这些变更中的任何内容

7.2. 垫片

7.2.1. 一些有助于连接应用程序旧版本和新版本的代码

7.3. 对测试来说，除了支持前滚，最好也要支持回滚

7.4. 不要忘记在真实的数据样本上测试数据库的模式变更

7.5. 测试时绝对不要依赖应用程序当前所谓的合法数据库模式

7.5.1. 会有用户最近10年从未登录过，所以现在必填的一些字段对他们来说就是一堆空值

7.6. 总会存在一些当前的应用程序绝对无法生成的数据，这就是必须要针对真实生产数据的副本进行测试的原因

8. 无模式数据库

8.1. 对数据库引擎而言，无模式数据库仅仅无模式而已，但对应用程序来说，就完全是另一回事了

8.2. 随着时间的推移，应用程序很有可能也在不断演化，原来旧版本的数据文档现在可能都不可读了

8.2.1. 编写应用程序，使其能够读取任何时间创建的版本

8.2.1.1. 所有版本之间的转换都必须经过测试，这意味着需要保留旧文档作为测试的种子数据

8.2.1.2. 随着流水线越来越深，翻译时间会线性增加

8.2.2. 编写部署期间在整个数据库运行的迁移例程

8.2.2.1. 旧实例读取旧文档，没问题

8.2.2.2. 新实例读取旧文档，没问题

8.2.2.3. 新实例读取新文档，没问题

8.2.2.4. 旧实例读取新文档，会出大问题

8.2.3. 先滴流再批量

8.2.3.1. 这个策略不会对所有文档进行一次大规模的迁移

8.2.3.2. 通过在应用程序新版本中添加一些条件码，迁移运行过程中涉及的那些文档

8.2.3.3. 在生产环境实行了一段时间的“先滴流再批量”之后，就会发现最活跃的文档都已更新

8.2.3.4. 此时就可以对其余文档执行批量迁移，这可以与生产环境同时运行，不会产生危险，因为此时没有旧实例参与

8.2.3.5. 优点

8.2.3.5.1. 能实现快速部署新的应用程序版本，无须停机进行数据迁移

8.2.3.5.2. 能在不中断服务的情况下部署代码，因此当不再需要迁移测试时，能够将其删除

8.2.3.6. 缺点

8.2.3.6.1. 不能对相同的文档类型执行不同的重复滴流迁移操作

8.2.3.6.2. 当面对一些较大的设计变更时，需要将其分散到多个版本中来实现

8.2.3.7. 对于任何大型迁移——通常在部署过程中执行时间很长——都可以采用这种方法

9. 让人类定义规则，让机器贯彻规则

9.1. 实现自动化操作和质量检查

9.2. 运维工作与开发工作已经变得难解难分，这就要求必须按照可部署的原则设计软件，就像设计用于生产环境的软件一样

10. Web资源

10.1. 缓存破坏（cache-busting）

10.1.1. 能够帮助浏览器、所有中间代理和缓存服务器获取最新的静态资源

10.2. 版本控制

10.2.1. Git生成的SHA值作为版本标识符

10.3. 会话黏性

11. 推出新代码

11.1. “收敛”式基础设施

11.1.1. 这种基础设施使用长寿命的机器，并由这些机器接受变更

11.1.2. 决定每次要更新的机器数量

11.1.3. “金丝雀”组

11.1.4. 要阻止流量发往机器，一种简单的方法就是将其从负载均衡器池中移除

11.1.5. 通过健康状况检查，应用程序中一个简单的状态变更，就可以通知负载均衡器不再向该机器发送任何新请求，该机器正在处理的请求会继续完成

11.2. "不可变”的基础设施

11.2.1. 要针对新版本的代码启用新机器

11.2.2. 随着新机器不断出现且通过了健康状况检查，它们将开始承担流量负载，这意味着需要实现会话黏性，否则某个调用方后续发来的请求，就可能不得不交给新版本机器（而不是旧版本机器）来处理

11.3. 如果部署非常频繁，那么最好是在现有集群中启用新机器，这样做可以避免打断正在处理的连接

11.4. 在所有的模式下，机器上的内存会话数据都会发生丢失，必须让用户了解到这一点

12. 清理

12.1. 如果工具用完后没有归位，那么工作不能算完成

12.2. 去除垫片

12.2.1. 一旦每个实例都部署了新代码，就不再需要那些触发器了，那时就可以删除它们

12.2.2. 对于新的数据库迁移，务必最后要执行这样的删除操作

12.3. 收缩（contraction），或“收紧”数据库模式

12.3.1. 撤销旧表

12.3.2. 撤销旧视图

12.3.3. 撤销旧列

12.3.4. 撤销不再使用的别名和近义词

12.3.5. 撤销不再被调用的存储过程

12.3.6. 在新列上应用非空约束

12.3.7. 应用外键约束

12.4. 清理阶段也是审查特征切换的好时机

12.4.1. 任何新的特征切换都应默认设置为“关闭”

到了这里，关于读发布！设计与部署稳定的分布式系统（第2版）笔记30_为部署而设计的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

读发布！设计与部署稳定的分布式系统（第2版）笔记29_控制层下

2024年02月14日
浏览(39)
读发布！设计与部署稳定的分布式系统（第2版）笔记28_控制层上

2.3.1.1. 专职运维人员的固定成本 2.3.1.2. 部署加速、事故恢复和服务整备等可变成本 6.8.2.1. 软件越难以运维，人们在运维上所花费的时间就越多 6.8.3.1. 有些语言能让程序员快速编程，但需要更多实例处理特定的工作负载（这样就增加了成本） 6.9.8.1. 大多数度量指标数据库

2024年02月14日
浏览(41)
读发布！设计与部署稳定的分布式系统（第2版）笔记32_适应性

8.3.1.1. 优点 8.3.1.1.1. 非常小的一次性代码单元 8.3.1.1.2. 强调容量的可伸缩性和团队规模的自治性 8.3.1.2. 缺点：在监控、跟踪和持续交付过程中容易与平台耦合 8.3.2.1. 优点 8.3.2.1.1. 进程内及内存中的消息传递内核，带有正式的扩展接口 8.3.2.1.2. 适合需求的增量变更，便于

2024年02月12日
浏览(49)
读发布！设计与部署稳定的分布式系统（第2版）笔记02_停飞的代码异常

2.1.1. 硬件的每一部分都有冗余 2.1.1.1. CPU 2.1.1.2. 驱动器 2.1.1.3. 网卡 2.1.1.4. 电源 2.1.1.5. 网络交换机 2.1.1.6. 风扇 2.1.2. 为了防止某个机架受到损坏或破坏，服务器甚至被分散安装到不同的机架上 2.1.3. 如果发生火灾、洪水、炸弹袭击，位于48千米外的第2个机房可以随时

2024年02月08日
浏览(92)
读发布！设计与部署稳定的分布式系统（第2版）笔记26_安全性上

4.6.2.1. 编程语言内置的rand（)函数可能并不是这种生成器 4.6.4.1. 发生会话固定攻击，攻击者将无法访问用户账户 4.6.5.1. 做了相关的强化来抵御绝大多数这类攻击 4.6.5.2. 要及时更新平台的安全补丁和版本 4.6.6.1. 有些服务器虽然使用cookie发出会话ID，但仍然能通过查询参数接

2024年02月15日
浏览(36)
读发布！设计与部署稳定的分布式系统（第2版）笔记27_安全性下

1.2.1.1. 我们忘记（或不知道）禁用它们，从而开放了这些未经配置和未被监控的系统入口点 4.2.2.1. 这个用户就成了攻击者的傀儡 4.2.3.1. 用户仅是看似拥有登录会话，并不意味着该请求是用户真正的意图 6.3.1.1. 如果一个客户的授权证书被盗，那很糟糕 6.3.1.2. 如果攻击者可

2024年02月15日
浏览(37)
读发布！设计与部署稳定的分布式系统（第2版）笔记08_自黑与放大

1.5.4.1. 锁管理器资源只有一个，随着网站横向扩展，锁管理器会成为瓶颈，并且最终会成为风险 1.5.4.2. 如果一个热门项目被无意修改，最终就可能会导致数以百计的服务器上出现数千个请求处理的线程，都在排队等待该项目的写入锁 5.7.1.1. 广播能够应对服务器数量的不断

2024年02月10日
浏览(44)
读发布！设计与部署稳定的分布式系统（第2版）笔记16_握手和考验机

2024年02月11日
浏览(45)
读发布！设计与部署稳定的分布式系统（第2版）笔记15_快速失败和替换

5.4.1.1. 必须为崩溃定义边界 5.4.1.2. 发生崩溃的组件应该是独立的，系统的其余部分必须能够自我防护，避免受到层叠失效的影响 5.4.1.3. 在微服务架构中，服务的整个实例可能是正确的崩溃粒度 5.4.1.4. 在Erlang和Elixir中，崩溃的自然边界就是actor 5.4.2.1. actor这样的进程内组件

2024年02月11日
浏览(44)
读发布！设计与部署稳定的分布式系统（第2版）笔记13_断路器与舱壁

2024年02月11日
浏览(46)