Kafka3.0.0版本——文件清理策略

1年前作者：小志的博客分类：Toy博客阅读(10)违法举报

这篇具有很好参考价值的文章主要介绍了Kafka3.0.0版本——文件清理策略。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

一、文件清理策略

1.1、文件清理策略的概述

Kafka 中默认的日志保存时间为 7 天，可以通过调整如下参数修改保存时间。

参数	解释
log.retention.hours	小时，最低优先级（默认 7天）
log.retention.minutes	分钟
log.retention.ms	毫秒，最高优先级
log.retention.check.interval.ms	负责设置检查周期（默认 5 分钟）

1.2、文件清理策略的官方文档

参考官方文档
官方文档地址：https://kafka.apache.org/documentation/

1.3、日志超过了设置的时间如何处理

Kafka 中提供的日志清理策略有 delete 和 compact两种。

1.3.1、delete日志删除（将过期数据删除）

log.cleanup.policy = delete 所有数据启用删除策略。
（1）、基于时间：默认打开。以 segment 中所有记录中的最大时间戳作为该文件时间戳。
（2）、基于大小：默认关闭。超过设置的所有日志总大小，删除最早的 segment。log.retention.bytes，默认等于-1，表示无穷大。

1.3.2、compact日志压缩

compact日志压缩：对于相同key的不同value值，只保留最后一个版本。
log.cleanup.policy = compact 所有数据启用压缩策略
压缩后的offset可能是不连续的，比如上图中没有6，当从这些offset消费消息时，将会拿到比这个offset大的offset对应的消息，实际上会拿到offset为7的消息，并从这个位置开始消费。
这种策略只适合特殊场景，比如消息的key是用户ID，value是用户的资料，通过这种压缩策略，整个消息集里就保存了所有用户最新的资料。

文章来源地址https://www.toymoban.com/news/detail-706890.html

到了这里，关于Kafka3.0.0版本——文件清理策略的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Kafka3.0.0版本——手动调整分区副本示例
四台服务器原始服务器名称原始服务器ip 节点 centos7虚拟机1 192.168.136.27 broker0 centos7虚拟机2 192.168.136.28 broker1 centos7虚拟机3 192.168.136.29 broker2 centos7虚拟机4 192.168.136.30 broker3 2.1、先启动zookeeper集群启动zookeeper集群 2.2、再启动kafka集群启动kafka集群 3.1、手动调整分区副本的前提
2024年02月11日
浏览(11)
Kafka3.0.0版本——Follower故障处理细节原理
三台服务器原始服务器名称原始服务器ip 节点 centos7虚拟机1 192.168.136.27 broker0 centos7虚拟机2 192.168.136.28 broker1 centos7虚拟机3 192.168.136.29 broker2 2.1、服务器基本信息首先，分别有3台服务器分别为broker0、broker1、broker2，其中一台为leader，2台follower服务器。每台服务器已经接收到
2024年02月10日
浏览(10)
Kafka3.0.0版本——Leader Partition自动平衡
正常情况下，Kafka 本身会自动把Leader Partition均匀分散在各个机器上，来保证每台机器的读写吞吐量都是均匀的。但是如果某些broker宕机，会导致Leader Partition过于集中在其他少部分几台broker上，这会导致少数几台broker的读写请求压力过高，其他宕机的broker重启之后都是foll
2024年02月11日
浏览(7)
Kafka3.0.0版本——Broker（退役旧节点）示例
三台服务器原始服务器名称原始服务器ip centos7虚拟机1 192.168.136.27 centos7虚拟机2 192.168.136.28 centos7虚拟机3 192.168.136.29 centos7虚拟机4 192.168.136.30 分别启动4台zookeeper 再分别启动4台kafka brokers中的ids=0、1、2、3都存在，说明4台kafka启动正常，如下图：查看kafka中的创建过的名称为
2024年02月13日
浏览(4)
Kafka3.0.0版本——Leader故障处理细节原理
三台服务器原始服务器名称原始服务器ip 节点 centos7虚拟机1 192.168.136.27 broker0 centos7虚拟机2 192.168.136.28 broker1 centos7虚拟机3 192.168.136.29 broker2 2.1、服务器基本信息首先，分别有3台服务器分别为broker0、broker1、broker2，其中一台为leader，2台follower服务器。每台服务器已经接收到
2024年02月11日
浏览(7)
Kafka3.0.0版本——生产者数据去重
1.1、至少一次至少一次（At Least Once ）的含义生产者发送数据到kafka集群，kafka集群至少接收到一次数据。至少一次的条件： ACK级别设置为-1 + 分区副本大于等于2 + ISR里应答的最小副本数量大于等于2 1.2、最多一次最多一次（At Most Once ）的含义生产者发送数据到kafka集群，
2024年02月01日
浏览(7)
Kafka3.0.0版本——Broker（Zookeeper服务端存储的Kafka相关信息）
1.1、先启动三台zookeeper集群服务，再启动三台kafka集群服务启动三台zookeeper集群服务启动三台kafka集群服务 1.2、使用PrettyZoo连接zookeeper客户端工具 PrettyZoo视化工具下载、安装、使用参考如下 Zookeeper可视化工具PrettyZoo的下载、安装链接：https://wwwxz.blog.csdn.net/article/details/1303
2024年02月14日
浏览(7)
Kafka3.0.0版本——消费者（自动提交 offset）
官网文档参数解释参数描述 enable.auto.commi 默认值为 true，消费者会自动周期性地向服务器提交偏移量。 auto.commit.interval.ms 如果设置了 enable.auto.commit 的值为 true，则该值定义了消费者偏移量向 Kafka 提交的频率，默认 5s。图解分析消费者自动提交 offset代码消费者自动提交
2024年02月09日
浏览(6)
Kafka3.0.0版本——消费者（手动提交offset）
1.1、手动提交offset的两种方式 commitSync（同步提交）：必须等待offset提交完毕，再去消费下一批数据。 commitAsync（异步提交）：发送完提交offset请求后，就开始消费下一批数据了。 1.2、手动提交offset两种方式的区别相同点：都会将本次提交的一批数据最高的偏移量提交。不
2024年02月09日
浏览(8)
Kafka3.0.0版本——生产者数据有序与乱序
单分区内，数据有序。如下图partion0、partion1、partion2分区内，各自分区内的数据有序。 2.1、kafka1.x版本之前保证数据单分区有序的条件 kafka在1.x版本之前保证数据单分区有序，条件如下： 2.2、kafka1.x版本及以后保证数据单分区有序的条件未开启幂等性开启幂等性 2.3、kafka1
2023年04月27日
浏览(8)