flink-对齐和不对齐，精准一次和至少一次

1年前作者：青云游子分类：Toy博客阅读(7)违法举报

这篇具有很好参考价值的文章主要介绍了flink-对齐和不对齐，精准一次和至少一次。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

精准一次怎么保证？可以设置为以下2个
1. 对齐
  1. 当有一个barrier比较快时，输入缓冲区阻塞，当另外一个barrier到来时，才进行备份，所以数据不会重复。
  2. 优点：不会造成数据重复
  3. 缺点：会造成数据积压，OOM
2. 不对齐
  1. 当有一个barrier到来时，直接将barrier置到最后，然后将所有缓冲区的数据和状态进行备份，然后将kafka提交，然后将慢的barrier也置到最后，将所有缓冲区的数据和状态进行备份，然后将kafka提交。
  2. 优点：加快了ck
  3. 缺点：由于备份了大量数据，会造成IO压力大，磁盘存储压力大
至少一次怎么保证？
1. 对齐
2. 当有一个barrier比较快时，输入缓冲区不阻塞，直接向下游流动，而barrier会等待另外一个barrier，当此次ck备份成功后，JM注入新的barrier，然后到一半的时候，备份失败了，kafka回滚，从HDFS中恢复上次的ck，恢复kafka的offset，由于不阻塞，所以会重新从kafka中拉取到重复的数据进行计算，就造成了数据的重复，就是至少一次语义。
3. 优点：不阻塞，不会造成数据积压，OOM
4. 缺点，会造成数据重复

文章来源地址https://www.toymoban.com/news/detail-726265.html

到了这里，关于flink-对齐和不对齐，精准一次和至少一次的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

【数据可靠性】Flink和Kafka连接时的精确一次保证
端到端的 exactly-once（精准一次） kafka - Flink - kafka 输入数据源端的 Kafka 可以对数据进行持久化保存，并可以重置偏移量（offset） Flink 内部可以通过检查点机制保证状态和处理结果的 exactly-once 语义两阶段提交（2PC）。写入 Kafka 的过程实际上是一个两段式的提交：处理完毕
2024年02月02日
浏览(6)
记一次Flink遇到性能瓶颈
这周的主要时间花在Flink上面，做了一个简单的从文本文件中读取数据，然后存入数据库的例子，能够正常的实现功能，但是遇到个问题，我有四台机器，自己搭建了一个standalone的集群，不论我把并行度设置多少，跑起来的耗时都非常接近，实在是百思不得其解。机器多似乎
2023年04月15日
浏览(10)
记一次 Flink 作业启动缓慢
应用发现，Hadoop集群的hdfs较之前更加缓慢，且离线ELT任务也以前晚半个多小时才能跑完。此前一直没有找到突破口所以没有管他，推测应该重启一下Hadoop集群就可以了。今天突然要重启一个Flink作业，发现有一个过程卡了五分钟。由上图可知09:36到09:41这两个过程中间花了五
2024年02月21日
浏览(34)
记一次模糊查询踩坑 Flink+ES
公司需要对商品名称进行模糊模糊查询，考虑到商品表存量数据千万级，直接数据库模糊查询效率肯定极其低下，所以选择使用 ElasticSearch 对商品信息进行模糊查询。因为需要代替原有的查询接口，保持原有查询接口的入参出参，所以需要全量+增量同步MySQL数据到ES进行索引
2024年02月05日
浏览(15)
记一次Flink通过Kafka写入MySQL的过程
一、前言总体思路：source --transform --sink ,即从source获取相应的数据来源，然后进行数据转换，将数据从比较乱的格式，转换成我们需要的格式，转换处理后，然后进行sink功能，也就是将数据写入的相应的数据库DB中或者写入Hive的HDFS文件存储。思路： pom部分放到最后面。二
2024年01月24日
浏览(14)
Flink---13、容错机制（检查点（保存、恢复、算法、配置）、状态一致性、端到端精确一次）
星光下的赶路人star的个人主页大鹏一日同风起，扶摇直上九万里在Flink中，有一套完整的容错机制来保证故障后的恢复，其中最重要的就是检查点。 1.1.1 检查点的保存 1、周
2024年02月08日
浏览(7)
【3Ds Max】使用捕捉工具、轴约束工具实现点的精准对齐
目录问题解决步骤一、在XYZ轴上都对齐二、只在一或两个轴上对齐举个例子，比如我想让如下的两个立方体的顶点对齐（在同一位置（XYZ轴都对齐），或仅在一个或两个轴上对齐）：主要使用捕捉工具实现一、在XYZ轴上都对齐 1. 点击或者按“S”键来开启捕捉工具
2024年02月11日
浏览(6)
Kafka系列之：记录一次Kafka Topic分区扩容，但是下游flink消费者没有自动消费新的分区的解决方法
生产环境Kafka集群压力大，Topic读写压力大，消费的lag比较大，因此通过扩容Topic的分区，增大Topic的读写性能理论上下游消费者应该能够自动消费到新的分区，例如flume消费到了新的分区，但是实际情况是存在flink消费者没有消费到新的分区出现无法消费topic新的分区这种情况
2024年02月14日
浏览(18)
大数据Flink（五十一）：Flink的引入和Flink的简介
文章目录 Flink的引入和Flink的简介一、Flink的引入 1、第1代——Hadoop MapReduce
2024年02月15日
浏览(9)
【Flink】 Flink实时读取mysql数据
准备你需要将这两个依赖添加到 pom.xml 中 mysql mysql-connector-java 8.0.0 读取 kafka 数据这里我依旧用的以前的 student 类，自己本地起了 kafka 然后造一些测试数据，这里我们测试发送一条数据则 sleep 10s，意味着往 kafka 中一分钟发 6 条数据。 package com.zhisheng.connectors.mysql.utils; impo
2024年02月03日
浏览(7)