Flink 状态概述

这篇具有很好参考价值的文章主要介绍了Flink 状态概述。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

算子任务分 :

  • 无状态 : 根据输入转换为输出 , 如 : map , filter , flatMap
  • 有状态 : 根据输入 , 状态 转换为输出 , 如 : 聚合算子 , 窗口算子

有状态算子的处理流程 :

  1. 算子任务接收到上游发来的数据
  2. 获取当前状态
  3. 根据业务逻辑进行计算,更新状态
  4. 得到计算结果,输出发送到下游任务

image.png

状态分类

Flink 状态分 :

  • 托管状态 (Managed State) : 状态的存储访问、故障恢复、重组统一由 Flink 管理,只用调接口
  • 原始状态 (Raw State) : 自定义,需开辟一块内存,由自我管理,实现状态的序列化 , 故障恢复

托管状态分 :

  • 算子状态 (Operator State) : 状态对同个任务共享 , 能作用到所有算子
  • 按键分区状态 (Keyed State) : 状态只对同 Key 共享 , 必须 keyBY 后才能用

算子状态 :

image.png

按键分区状态 :

image.png文章来源地址https://www.toymoban.com/news/detail-499074.html

到了这里,关于Flink 状态概述的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Flink 状态概述

    算子任务分 : 无状态 : 根据输入转换为输出 , 如 : map , filter , flatMap 有状态 : 根据输入 , 状态 转换为输出 , 如 : 聚合算子 , 窗口算子 有状态算子的处理流程 : 算子任务接收到上游发来的数据 获取当前状态 根据业务逻辑进行计算,更新状态 得到计算结果,输出发送到下游任务

    2024年02月10日
    浏览(38)
  • Flink 系列二 Flink 状态化流处理概述

    本篇作为Flink系列的第二篇,第一篇是环境准备,需要的同学可以看:https://blog.csdn.net/lly576403061/article/details/130358449?spm=1001.2014.3001.5501。希望可以通过系统的学习巩固该方面的知识,丰富自己的技能树。废话不多说咱们开始吧。 在我们的日常生活中数据和数据处理无处不在,

    2024年02月11日
    浏览(41)
  • Flink的状态是否支持任务间共享

    在日常编写代码的过程中,我们经常会在方法内部new很多的其他类对象来进行编码工作,那么对于这种情况怎么让new出来的对象是一个我们特意创建出来的一个mock实例,从而让我们能完全控制new出来的对象的所有行为呢?本文就来讲解下如何在powermock中mock类的构造函数。 首

    2024年02月13日
    浏览(32)
  • Flink作业任务的9种状态简单介绍

    ​ 当创建一个Flink任务后,该任务可能会经历多种状态。目前Flink给任务共定义了9种状态,包括: Created , Running , Finished , Cancelling , Canceled , Restarting , Failing , Failed , Suspended 。下面这张图详细展示了一个Job可能会经历的所有状态。 最简单的一种状态就是:作业启动

    2024年02月02日
    浏览(33)
  • 206.Flink(一):flink概述,flink集群搭建,flink中执行任务,单节点、yarn运行模式,三种部署模式的具体实现

    Flink官网地址:Apache Flink® — Stateful Computations over Data Streams | Apache Flink Flink是一个 框架 和 分布式处理引擎 ,用于对 无界 和 有界 数据流进行 有状态计算 。 无界流(流): 有定义流的开始,没有定义结束。会无休止产生数据 无界流数据必须持续处理 有界流(批): 有定

    2024年02月11日
    浏览(49)
  • 【状态管理|概述】Flink的状态管理:为什么需要state、怎么保存state、对于state过大怎么处理

    按照数据的划分和扩张方式,Flink中大致分为2类: Keyed States:记录每个Key对应的状态值 因为一个任务的并行度有多少,就会有多少个子任务,当key的范围大于并行度时,就会出现一个subTask上可能包含多个Key(),但不同Task上不会出现相同的Key(解决了shuffle的问题?)   常

    2024年02月01日
    浏览(57)
  • Flink复习3-2-4-6-1(v1.17.0): 应用开发 - DataStream API - 状态和容错 - 数据类型&序列化 - 概述

    Apache Flink handles data types and serialization in a unique way, containing its own type descriptors, generic type extraction, and type serialization framework. This document describes the concepts and the rationale behind them. Apache Flink以独特的方式处理数据类型和序列化,包含自己的类型描述符、泛型类型提取和类型序列化

    2024年02月12日
    浏览(52)
  • Flink源算子、转换算子和输出算子(DataSet)

    Flink是一种一站式处理的框架,既可以进行批处理(DataSet),也可以进行流处理(DataStream) 将Flink的算子分为两大类:DataSet 和 DataStream 1.1 fromCollection 从本地集合读取数据 1.2 readTextFile 从文件中读取 1.3 readTextFile 遍历目录 对一个文件目录内的所有文件,包括所有子目录中的

    2024年04月23日
    浏览(39)
  • 【Flink-1.17-教程】-【四】Flink DataStream API(2)转换算子(Transformation)【基本转换算子、聚合算子】

    数据源读入数据之后,我们就可以使用各种转换算子,将一个或多个 DataStream 转换为新的 DataStream。 map 是大家非常熟悉的大数据操作算子,主要用于将数据流中的数据进行转换,形成新的数据流。简单来说,就是一个 “一 一映射”,消费一个元素就产出一个元素 。 我们只

    2024年01月23日
    浏览(49)
  • [flink 实时流基础]源算子和转换算子

    Flink可以从各种来源获取数据,然后构建DataStream进行转换处理。一般将数据的输入来源称为数据源(data source),而读取数据的算子就是源算子(source operator)。所以,source就是我们整个处理程序的输入端。 在Flink1.12以前,旧的添加source的方式,是调用执行环境的addSource()方

    2024年04月11日
    浏览(45)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包