Flink状态容错savepoint与checkpoint

1年前作者：大数据技术派分类：Toy博客阅读(8)违法举报

这篇具有很好参考价值的文章主要介绍了Flink状态容错savepoint与checkpoint。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

本文目录

Checkpoints
- State Backends
Savepoints
Checkpoints 与 Savepoints区别

Flink可以保证exactly once，与其容错机制checkpoint和savepoint分不开的。本文主要讲解两者的机制与使用，同时会对比两者的区别。

Checkpoints

Checkpoint 使 Flink 的状态具有良好的容错性，通过 checkpoint 机制，Flink 可以对作业的状态和计算位置进行恢复。Flink 中的每个方法或算子都能够是有状态的，状态化的方法在处理单个元素/事件的时候存储数据，让状态成为使各个类型的算子更加精细的重要部分。为了让状态容错，Flink 需要为状态添加 checkpoint（检查点）。Checkpoint 使得 Flink 能够恢复状态和在流中的位置，从而向应用提供和无故障执行时一样的语义。

Flink 的 checkpoint 机制会和持久化存储进行交互，读写流与状态。一般需要：

一个能够回放一段时间内数据的持久化数据源，例如持久化消息队列（例如 Apache Kafka、RabbitMQ、 Amazon Kinesis、 Google PubSub 等）或文件系统（例如 HDFS、 S3、 GFS、 NFS、 Ceph 等）。
存放状态的持久化存储，通常为分布式文件系统（比如 HDFS、 S3、 GFS、 NFS、 Ceph 等）。文章来源地址https://www.toymoban.com/news/detail-775916.html

1.

到了这里，关于Flink状态容错savepoint与checkpoint的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Flink理论—容错之状态
在 Flink 的框架中，进行有状态的计算是 Flink 最重要的特性之一。所谓的状态，其实指的是 Flink 程序的中间计算结果。Flink 支持了不同类型的状态，并且针对状态的持久化还提供了专门的机制和状态管理器。 Flink 使用流重放和检查点的组合来实现容错。检查点标记每个输
2024年02月20日
浏览(8)
Flink｜《Flink 官方文档 - DataStream API - 状态与容错 - 使用状态》学习笔记
学习文档：Flink 官方文档 - DataStream API - 状态与容错 - 使用状态相关文档：有状态流处理背后的概念：Flink｜《Flink 官方文档 - 概念透析 - 有状态流处理》学习笔记 Redis 过期 key 的删除机制：Redis｜过期 key 的删除机制学习笔记如下：如果要使用键控状态，则必须要为 DataS
2024年02月03日
浏览(7)
【Flink状态管理五】Checkpoint的设计与实现
由于系统原因导致Flink作业无法正常运行的情况非常多，且很多时候都是无法避免的。对于Flink集群来讲，能够快速从异常状态中恢复，同时保证处理数据的正确性和一致性非常重要。Flink主要借助Checkpoint的方式保障整个系统状态数据的一致性，也就是基于ABS算法实现轻量级快
2024年02月21日
浏览(9)
flink如何利用checkpoint保证数据状态一致性
这本质上是一『尽力而为』的方法。保证数据或事件最多由应用程序中的所有算子处理一次。这意味着如果数据在被流应用程序完全处理之前发生丢失，则不会进行其他重试或者重新发送。下图中的例子说明了这种情况。应用程序中的所有算子都保证数据或事件至少被处理
2024年02月21日
浏览(19)
209.Flink（四）：状态，按键分区，算子状态，状态后端。容错机制，检查点，保存点。状态一致性。flink与kafka整合
算子任务可以分为有状态、无状态两种。无状态：filter,map这种，每次都是独立事件有状态：sum这种，每次处理数据需要额外一个状态值来辅助。这个额外的值就叫“状态” （1）托管状态（Managed State）和原始状态（Raw State）托管状态就是由Flink统一管理的，状态的存储访问
2024年02月06日
浏览(6)
Flink理论—容错之状态后端(State Backends)
Flink 使用流重放和检查点的组合来实现容错。检查点标记每个输入流中的特定点以及每个运算符的相应状态。通过恢复运算符的状态并从检查点点重放记录，可以从检查点恢复流数据流，同时保持一致性容错机制不断地绘制分布式流数据流的快照。对于小状态的流式应用程
2024年02月20日
浏览(13)
Flink分流，合流，状态，checkpoint和精准一次笔记
第8章分流 1.使用侧输出流 2.合流 2.1 union ：使用 ProcessFunction 处理合流后的数据 2.2 Connect ：两条流的格式可以不一样， map操作使用CoMapFunction，process 传入：CoProcessFunction 2.2 BroadcastConnectedStream keyBy 进行了按键分区，那么要传入的就是 KeyedBroadcastProcessFunction；如果没有按键分
2024年02月12日
浏览(7)
【Flink状态管理（六）】Checkpoint的触发方式（1）通过CheckpointCoordinator触发算子的Checkpoint操作
Checkpoint的触发方式有两种一种是数据源节点中的Checkpoint操作触发，通过CheckpointCoordinator组件进行协调和控制。 CheckpointCoordinator通过注册定时器的方式按照配置的时间间隔触发数据源节点的Checkpoint操作。数据源节点会向下游算子发出Checkpoint Barrier事件，供下游节点使用。
2024年02月21日
浏览(10)
Flink---13、容错机制（检查点（保存、恢复、算法、配置）、状态一致性、端到端精确一次）
星光下的赶路人star的个人主页大鹏一日同风起，扶摇直上九万里在Flink中，有一套完整的容错机制来保证故障后的恢复，其中最重要的就是检查点。 1.1.1 检查点的保存 1、周
2024年02月08日
浏览(7)
Flink复习3-2-4-6-1(v1.17.0)：应用开发 - DataStream API - 状态和容错 - 数据类型&序列化 - 概述
Apache Flink handles data types and serialization in a unique way, containing its own type descriptors, generic type extraction, and type serialization framework. This document describes the concepts and the rationale behind them. Apache Flink以独特的方式处理数据类型和序列化，包含自己的类型描述符、泛型类型提取和类型序列化
2024年02月12日
浏览(10)