Flink 状态后端

9月前作者：cpuCode 分类：Toy博客阅读(44) 违法举报

这篇具有很好参考价值的文章主要介绍了Flink 状态后端。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

状态后端 (state backend) : 负责管理本地状态的存储方式, 位置

Flink 的状态后端有两类 :

哈希表状态后端 (HashMapStateBackend) : 状态放在内存
内嵌 RocksDB 状态后端 (EmbeddedRocksDBStateBackend) : 状态放在 RocksDB 数据库

哈希表状态后端 :

实现 : 将状态当作对象 (objects) , 保存在 Taskmanager 的 JVM 堆上
优点 : 内存计算，读写速度很快
缺点 : 状态的大小受集群可用内存的限制 , 当状态随时间增长，会耗尽内存

RocksDB 状态后端 :

实现 : 异步存储到 TaskManager 的本地目录
优点 : 硬盘存储 , 适合海量状态的存储
缺点 : 读写性能比哈希表慢些

配置

flink-conf.yaml :

全局有效

# hashmap: HashMapStateBackend
# rocksdb: EmbeddedRocksDBStateBackend
# 默认状态后端
state.backend: hashmap

# 检查点和元数据写入目录
state.checkpoints.dir: hdfs://hadoop102:8020/flink/checkpoints

单作业 :

StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

env.setStateBackend(new HashMapStateBackend());

// EmbeddedRocksDBStateBackend
// env.setStateBackend(new EmbeddedRocksDBStateBackend());

idae 本地启动 , 用 RocksDB 依赖 :文章来源地址https://www.toymoban.com/news/detail-549660.html

<dependency>
    <groupId>org.apache.flink</groupId>
    <artifactId>flink-statebackend-rocksdb</artifactId>
    <version>${flink.version}</version>
</dependency>

到了这里，关于Flink 状态后端的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Flink系列之：使用Flink CDC从数据库采集数据，设置checkpoint支持数据采集中断恢复，保证数据不丢失

博主相关技术博客： Flink系列之：Debezium采集Mysql数据库表数据到Kafka Topic，同步kafka topic数据到StarRocks数据库 Flink系列之：使用Flink Mysql CDC基于Flink SQL同步mysql数据到StarRocks数据库

2024年02月11日
浏览(85)
Flink State backend状态后端

Flink在v1.12到v1.14的改进当中，其状态后端也发生了变化。老版本的状态后端有三个，分别是MemoryStateBackend、FsStateBackend、RocksDBStateBackend，在flink1.14中，这些状态已经被废弃了，新版本的状态后端是 HashMapStateBackend、EmbeddedRocksDBStateBackend。有状态流应用中的检查点（checkpoint），

2024年01月25日
浏览(44)
209.Flink（四）：状态，按键分区，算子状态，状态后端。容错机制，检查点，保存点。状态一致性。flink与kafka整合

算子任务可以分为有状态、无状态两种。无状态：filter,map这种，每次都是独立事件有状态：sum这种，每次处理数据需要额外一个状态值来辅助。这个额外的值就叫“状态” （1）托管状态（Managed State）和原始状态（Raw State）托管状态就是由Flink统一管理的，状态的存储访问

2024年02月06日
浏览(52)
Flink理论—容错之状态后端(State Backends)

Flink 使用流重放和检查点的组合来实现容错。检查点标记每个输入流中的特定点以及每个运算符的相应状态。通过恢复运算符的状态并从检查点点重放记录，可以从检查点恢复流数据流，同时保持一致性容错机制不断地绘制分布式流数据流的快照。对于小状态的流式应用程

2024年02月20日
浏览(39)
Flink读取mysql数据库(java)

代码如下: 运行结果如下:

2024年02月12日
浏览(42)
[大数据 Flink,Java实现不同数据库实时数据同步过程]

目录 🌮前言: 🌮实现Mysql同步Es的过程包括以下步骤： 🌮配置Mysql数据库连接 🌮在Flink的配置文件中，添加Mysql数据库的连接信息。可以在flink-conf.yaml文件中添加如下配置： 🌮在Flink程序中，使用JDBCInputFormat来连接Mysql数据库，并定义查询语句，获取需要同步的数据。具体代

2024年02月10日
浏览(45)
【Flink实战】Flink hint更灵活、更细粒度的设置Flink sql行为与简化hive连接器参数设置

SQL 提示（SQL Hints）是和 SQL 语句一起使用来改变执行计划的。本章介绍如何使用 SQL 提示来实现各种干预。 SQL 提示一般可以用于以下：增强 planner：没有完美的 planner， SQL 提示让用户更好地控制执行；增加元数据（或者统计信息）：如\\\"已扫描的表索引\\\"和\\\"一些混洗键（shu

2024年04月25日
浏览(39)
【大数据】Flink 架构（四）：状态管理

《 Flink 架构》系列（已完结），共包含以下 6 篇文章： Flink 架构（一）：系统架构 Flink 架构（二）：数据传输 Flink 架构（三）：事件时间处理 Flink 架构（四）：状态管理 Flink 架构（五）：检查点 Checkpoint（看完即懂） Flink 架构（六）：保存点 Savepoint 😊 如果您觉得这篇

2024年02月19日
浏览(44)
大数据-玩转数据-Flink状态编程（上）

有状态的计算是流处理框架要实现的重要功能，因为稍复杂的流处理场景都需要记录状态，然后在新流入数据的基础上不断更新状态。 SparkStreaming在状态管理这块做的不好, 很多时候需要借助于外部存储(例如Redis)来手动管理状态, 增加了编程的难度。 Flink的状态管理是它的优

2024年02月09日
浏览(47)
【大数据】Flink 详解（十）：SQL 篇 Ⅲ（Flink SQL CDC）

《 Flink 详解》系列（已完结），共包含以下 10 10 10 篇文章：【大数据】Flink 详解（一）：基础篇（架构、并行度、算子）【大数据】Flink 详解（二）：核心篇 Ⅰ（窗口、WaterMark）【大数据】Flink 详解（三）：核心篇 Ⅱ（状态 State）【大数据】Flink 详解（四）：核心篇

2024年01月25日
浏览(50)