Flink｜《Flink 官方文档 - 概念透析 - Flink 架构》学习笔记-Toy模板网

这篇具有很好参考价值的文章主要介绍了Flink｜《Flink 官方文档 - 概念透析 - Flink 架构》学习笔记。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

学习文档：概念透析 - Flink 架构

学习笔记如下：

flink 学习文档,Flink,flink,架构,集群

客户端（Client）：准备数据流程序并发送给 JobManager（不是 Flink 执行程序的进程）
JobManager：协调 Flink 应用程序的分布式执行
- ResourceManager：负责 Flink 集群中的资源提供、回收、分配
- Dispatcher：提供了用来提交 Flink 应用程序执行的 REST 接口，并为每个提交的作业启动一个新的 JobMaster；运行 Flink WebUI 用来提供作业执行信息
- JobMaster：负责管理单个 JobGraph 的执行；每个作业都有自己的 JobMaster。
TaskManager：执行作业流的 task，并且缓存和交换数据流
- task slot：TaskManager 中资源调度的最小单位是 task slot；TaskManager 中 task slot 的数量表示并发处理 task 的数量；每个 task slot可以执行多个算子。

每个 task 由一个线程执行。

合并算子为算子链的原因：

flink 学习文档,Flink,flink,架构,集群

在上图中：

每个 TaskManager 是一个 JVM 进程
每个 subtask 是一个单独的线程
task slot 用于管理每个 TaskManager 中能够接收的 task 数量：TaskManager 会将内存平均分给每个 task slot，但不会分隔 CPU

flink 学习文档,Flink,flink,架构,集群

多个 slot 共享同一 JVM 进程的优点：共享 TCP 连接（通过多路复用）和心跳信息，共享数据集和数据结构，从而减少了每个 task 的开销

Flink 允许 subtask 共享 slot，即便它们是不同的 task 的 subtask，只要是来自于同一作业即可。结果就是一个 slot 可以持有整个作业管道。

flink 学习文档,Flink,flink,架构,集群

允许 slot 共享有两个主要优点：

Flink 集群所需的 task slot 和作业中使用的最大并行度恰好一样。无需计算程序总共包含多少个 task（具有不同并行度）。
容易获得更好的资源利用。如果没有 slot 共享，非密集 subtask（source/map()）将阻塞和密集型 subtask（window）一样多的资源。通过 slot 共享，我们示例中的基本并行度从 2 增加到 6，可以充分利用分配的资源，同时确保繁重的 subtask 在 TaskManager 之间公平分配。

集群生命周期：

资源隔离：文章来源地址https://www.toymoban.com/news/detail-805491.html

可以节省大量时间申请资源和启动 TaskManager；适用于作业执行时间短并且启动时间长会对端到端的用户体验产生负面影响的场景。

集群生命周期：

客户端首先从集群管理器请求资源启动 JobManager，然后将作业提交给在这个进程中运行的 Dispatcher，然后根据作业的资源请求惰性的分配 TaskManager
集群管理器（例如 YARN）为每个提交的作业启动一个集群，并且该集群仅可用于该作业
一旦作业完成，Flink Job 集群将被拆除

资源隔离：

ResourceManager 必须应用并等待外部资源管理组件来启动 TaskManager 进程和分配资源。适用于更适合长期运行、具有高稳定性要求且对较长的启动时间不敏感的大型作业。

集群生命周期：

仅从 Flink 应用程序执行作业，并且 main()方法在集群上而不是客户端上运行
在提交作业时，将应用程序逻辑和依赖打包成一个可执行的作业 JAR 中，并且集群入口（ApplicationClusterEntryPoint）负责调用 main()方法来提取 JobGraph
Flink Application 集群的寿命与 Flink 应用程序的寿命有关

资源隔离：