flinksql实时统计程序背压延迟优化

7月前作者：小卢的博客分类：Toy博客阅读(17) 违法举报

这篇具有很好参考价值的文章主要介绍了flinksql实时统计程序背压延迟优化。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

问题：

flinkcdc+flinksql做实时读取sls日志和实时统计业务指标，今天发现程序背压了，业务延迟了6个小时。

解决办法：

1、资源优化
作业并发大时：在作业的高级配置的资源配置中，增加JobManager的资源，提高CPU和内存的大小，例如：Job Manager cpu设置为4。Job Manager Memory设置为8 GiB。
作业拓扑较复杂时，在作业的高级配置的资源配置中，增加TaskManager的资源，提高CPU和内存的大小，例如：Task Manager CPUs设置为4。Task Manager Memory设置为8 GiB。
2、sql优化
开启MiniBatch（提升吞吐）:
table.exec.mini-batch.enabled: true
table.exec.mini-batch.allow-latency: 5s
MiniBatch是缓存一定的数据后再触发处理，以减少对State的访问，从而提升吞吐并减少数据的输出量。MiniBatch主要基于事件消息来触发微批处理，事件消息会按您指定的时间间隔在源头插入。

复盘

下面是实时延迟时的截图：
flinksql实时统计程序背压延迟优化,flink
下面是实时追上数据时的截图：

bingo：我开启了MiniBatch配置，以5秒微批的方式做实时处理，程序性能直接飞速提升，6小时的延迟十几分钟就追上了。性能杠杠的！文章来源地址https://www.toymoban.com/news/detail-653113.html

到了这里，关于flinksql实时统计程序背压延迟优化的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Flink系列之：背压下的检查点

通常情况下，对齐 Checkpoint 的时长主要受 Checkpointing 过程中的同步和异步两个部分的影响。然而，当 Flink 作业正运行在严重的背压下时，Checkpoint 端到端延迟的主要影响因子将会是传递 Checkpoint Barrier 到所有的算子/子任务的时间。这在 checkpointing process) 的概述中有说明原因

2024年02月04日
浏览(32)
Flink实时计算资源如何优化

flink实时计算任务可以从以下四个方面进行优化内存优化：Flink任务需要大量的内存来存储数据和状态信息。因此，我们需要尽可能地减少内存的使用量。可以通过以下几种方式来实现：使用更小的窗口大小：窗口大小越大，需要使用的内存就越多。因此，我们可以使用更小

2024年02月10日
浏览(30)
实时Flink的数据库与Kafka集成优化案例

在现代数据处理系统中，实时数据处理和分析是至关重要的。Apache Flink是一个流处理框架，可以用于实时数据处理和分析。在许多场景下，Flink需要与数据库和Kafka等消息系统进行集成，以实现更高效的数据处理。本文将讨论Flink与数据库和Kafka集成的优化案例，并提供实际示

2024年02月20日
浏览(35)
实时数仓建设第2问：怎样使用flink sql快速无脑统计当天下单各流程（已发货，确认收货等等）状态的订单数量

实时统计当天下单各流程状态(已支付待卖家发货，卖家通知物流揽收，待买家收货等等)中的订单数量。订单表的binlog数据发送到kafka,flink从kafka接受消息进行指标统计。因为每笔订单的状态会发生变化，比如上午为【已支付待卖家发货】，这个时候【已支付待卖家发货】指标

2024年02月16日
浏览(30)
Flink 学习十 FlinkSQL

flink sql 基于flink core ,使用sql 语义方便快捷的进行结构化数据处理的上层库; 类似理解sparksql 和sparkcore , hive和mapreduce 1.1 工作流程整体架构和工作流程数据流,绑定元数据 schema ,注册成catalog 中的表 table / view 用户使用table Api / table sql 来表达计算逻辑 table-planner利用 apache calci

2024年02月10日
浏览(35)
Flink：FlinkSql解析嵌套Json

日常开发中都是用的简便json格式，但是偶尔也会遇到嵌套json的时候，因此在用flinksql的时候就有点麻烦，下面用简单例子简单定义处理下 1，数据是网上摘抄，但包含里常用的大部分格式 { \\\"afterColumns\\\": { \\\"created\\\": \\\"1589186680\\\", \\\"extra\\\": { \\\"

2023年04月09日
浏览(24)
flink学习35：flinkSQL查询mysql

import org.apache.flink.streaming.api.scala.StreamExecutionEnvironment import org.apache.flink.table.api.EnvironmentSettings import org.apache.flink.table.api.bridge.scala.{StreamTableEnvironment, tableConversions} object sqlQueryTable { def main(args: Array[String]): Unit = { //create env val env = StreamExecutionEnvironment.getExecutionEnv

2023年04月23日
浏览(38)
Flink实战-（6）FlinkSQL实现CDC

FlinkSQL说明 Flink SQL 是 Flink 实时计算为简化计算模型，降低用户使用实时计算门槛而设计的一套符合标准 SQL 语义的开发语言。自 2015 年开始，阿里巴巴开始调研开源流计算引擎，最终决定基于 Flink 打造新一代计算引擎，针对 Flink 存在的不足进行优化和改进，并且在 2019 年初

2023年04月26日
浏览(42)
【Flink系列七】TableAPI和FlinkSQL初体验

Apache Flink 有两种关系型 API 来做流批统一处理：Table API 和 SQL Table API 是用于 Scala 和 Java 语言的查询API，它可以用一种非常直观的方式来组合使用选取、过滤、join 等关系型算子。 Flink SQL 是基于 Apache Calcite 来实现的标准 SQL。无论输入是连续的（流式）还是有界的（批处理

2024年02月03日
浏览(28)
【Flink】FlinkSQL中执行计划以及如何用代码看执行计划

FilnkSQL怎么查询优化 Apache Flink 使用并扩展了 Apache Calcite 来执行复杂的查询优化。这包括一系列基于规则和成本的优化，例如： • 基于 Apache Calcite 的子查询解相关 • 投影剪裁 • 分区剪裁 • 过滤器下推 • 子计划消除重复数据以避免重复计算 • 特殊子查询重写，包括两部

2023年04月11日
浏览(43)