Flink 状态概述

6月前作者：cpuCode 分类：Toy博客阅读(38) 违法举报

这篇具有很好参考价值的文章主要介绍了Flink 状态概述。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

算子任务分 :

无状态 : 根据输入转换为输出 , 如 : map , filter , flatMap
有状态 : 根据输入 , 状态转换为输出 , 如 : 聚合算子 , 窗口算子

有状态算子的处理流程 :

算子任务接收到上游发来的数据
获取当前状态
根据业务逻辑进行计算，更新状态
得到计算结果，输出发送到下游任务

状态分类

Flink 状态分 :

托管状态 (Managed State) : 状态的存储访问、故障恢复、重组统一由 Flink 管理，只用调接口
原始状态 (Raw State) : 自定义，需开辟一块内存，由自我管理，实现状态的序列化 , 故障恢复

托管状态分 :

算子状态 (Operator State) : 状态对同个任务共享 , 能作用到所有算子
按键分区状态 (Keyed State) : 状态只对同 Key 共享 , 必须 keyBY 后才能用

算子状态 :

按键分区状态 :

文章来源地址https://www.toymoban.com/news/detail-499074.html

到了这里，关于Flink 状态概述的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Flink 状态概述

算子任务分 : 无状态 : 根据输入转换为输出 , 如 : map , filter , flatMap 有状态 : 根据输入 , 状态转换为输出 , 如 : 聚合算子 , 窗口算子有状态算子的处理流程 : 算子任务接收到上游发来的数据获取当前状态根据业务逻辑进行计算，更新状态得到计算结果，输出发送到下游任务

2024年02月10日
浏览(38)
Flink 系列二 Flink 状态化流处理概述

本篇作为Flink系列的第二篇，第一篇是环境准备，需要的同学可以看：https://blog.csdn.net/lly576403061/article/details/130358449?spm=1001.2014.3001.5501。希望可以通过系统的学习巩固该方面的知识，丰富自己的技能树。废话不多说咱们开始吧。在我们的日常生活中数据和数据处理无处不在，

2024年02月11日
浏览(41)
Flink的状态是否支持任务间共享

在日常编写代码的过程中，我们经常会在方法内部new很多的其他类对象来进行编码工作，那么对于这种情况怎么让new出来的对象是一个我们特意创建出来的一个mock实例，从而让我们能完全控制new出来的对象的所有行为呢？本文就来讲解下如何在powermock中mock类的构造函数。首

2024年02月13日
浏览(32)
Flink作业任务的9种状态简单介绍

当创建一个Flink任务后，该任务可能会经历多种状态。目前Flink给任务共定义了9种状态，包括： Created ， Running ， Finished ， Cancelling ， Canceled ， Restarting ， Failing ， Failed ， Suspended 。下面这张图详细展示了一个Job可能会经历的所有状态。最简单的一种状态就是：作业启动

2024年02月02日
浏览(33)
206.Flink（一）：flink概述，flink集群搭建，flink中执行任务，单节点、yarn运行模式，三种部署模式的具体实现

Flink官网地址：Apache Flink® — Stateful Computations over Data Streams | Apache Flink Flink是一个框架和分布式处理引擎，用于对无界和有界数据流进行有状态计算。无界流（流）：有定义流的开始，没有定义结束。会无休止产生数据无界流数据必须持续处理有界流（批）：有定

2024年02月11日
浏览(49)
【状态管理｜概述】Flink的状态管理：为什么需要state、怎么保存state、对于state过大怎么处理

按照数据的划分和扩张方式，Flink中大致分为2类： Keyed States：记录每个Key对应的状态值因为一个任务的并行度有多少，就会有多少个子任务，当key的范围大于并行度时，就会出现一个subTask上可能包含多个Key（），但不同Task上不会出现相同的Key（解决了shuffle的问题？）常

2024年02月01日
浏览(57)
Flink复习3-2-4-6-1(v1.17.0)：应用开发 - DataStream API - 状态和容错 - 数据类型&序列化 - 概述

Apache Flink handles data types and serialization in a unique way, containing its own type descriptors, generic type extraction, and type serialization framework. This document describes the concepts and the rationale behind them. Apache Flink以独特的方式处理数据类型和序列化，包含自己的类型描述符、泛型类型提取和类型序列化

2024年02月12日
浏览(52)
Flink源算子、转换算子和输出算子（DataSet）

Flink是一种一站式处理的框架，既可以进行批处理（DataSet），也可以进行流处理（DataStream）将Flink的算子分为两大类：DataSet 和 DataStream 1.1 fromCollection 从本地集合读取数据 1.2 readTextFile 从文件中读取 1.3 readTextFile 遍历目录对一个文件目录内的所有文件，包括所有子目录中的

2024年04月23日
浏览(39)
【Flink-1.17-教程】-【四】Flink DataStream API（2）转换算子（Transformation）【基本转换算子、聚合算子】

数据源读入数据之后，我们就可以使用各种转换算子，将一个或多个 DataStream 转换为新的 DataStream。 map 是大家非常熟悉的大数据操作算子，主要用于将数据流中的数据进行转换，形成新的数据流。简单来说，就是一个 “一一映射”，消费一个元素就产出一个元素。我们只

2024年01月23日
浏览(49)
[flink 实时流基础]源算子和转换算子

Flink可以从各种来源获取数据，然后构建DataStream进行转换处理。一般将数据的输入来源称为数据源（data source），而读取数据的算子就是源算子（source operator）。所以，source就是我们整个处理程序的输入端。在Flink1.12以前，旧的添加source的方式，是调用执行环境的addSource()方

2024年04月11日
浏览(45)