kafka 是如何清理过期数据

9月前作者：高个子男孩分类：Toy博客阅读(32) 违法举报

这篇具有很好参考价值的文章主要介绍了kafka 是如何清理过期数据。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

kafka 将数据持久化到了硬盘上，允许你配置一定的策略对数据清理，清理的策略有两个，删除和压缩。

数据清理的方式

1、删除

log.cleanup.policy=delete启用删除策略

直接删除，删除后的消息不可恢复。可配置以下两个策略：

#清理超过指定时间清理： log.retention.hours=16

#超过指定大小后，删除旧的消息： log.retention.bytes=1073741824

为了避免在删除时阻塞读操作，采用了copy-on-write形式的实现，删除操作进行时，读取操作的二分查找功能实际是在一个静态的快照副本上进行的，这类似于 Java 的 CopyOnWriteArrayList。

2、压缩

将数据压缩，只保留每个 key 最后一个版本的数据。

首先在 broker 的配置中设置log.cleaner.enable=true启用 cleaner，这个默认是关闭的。

在 topic 的配置中设置log.cleanup.policy=compact启用压缩策略。文章来源地址https://www.toymoban.com/news/detail-509444.html

到了这里，关于kafka 是如何清理过期数据的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Redis追本溯源（三）内核：线程模型、网络IO模型、过期策略与淘汰机制、持久化

Redis在处理客户端请求时，通常使用单线程来进行读取、解析、执行和响应返回，因此被称为单线程应用。在4.0版本之前，这一描述是准确的。单线程：读取、解析、执行和响应返回。从4.0版本开始，Redis开始使用后台线程来处理一些耗时的操作，如清理脏数据、释放超时连

2024年02月15日
浏览(48)
浅谈Kafka持久化与日志存储

Apache Kafka是一个分布式流处理平台，用于构建实时数据流管道和流式应用程序。Kafka具有高吞吐量、低延迟、可扩展性和容错性等特点。本文档将介绍Kafka的持久化与日志存储机制，包括Kafka的存储架构、数据压缩和数据清理等；此外还将分析如何在 Kafka 中进行日志监控和维护

2024年02月03日
浏览(42)
kafka 是如何清理过期数据

kafka 将数据持久化到了硬盘上，允许你配置一定的策略对数据清理，清理的策略有两个，删除和压缩。数据清理的方式 1、删除 log.cleanup.policy=delete启用删除策略直接删除，删除后的消息不可恢复。可配置以下两个策略： #清理超过指定时间清理： log.retention.hours=16 #超过指

2024年02月11日
浏览(32)
如何在 uniapp 里面使用 pinia 数据持久化 (pinia-plugin-persistedstate)

想要在 uniapp 里面使用 pinia-plugin-persistedstate 会遇到的问题就是 uniapp里面没有浏览器里面的 sessionStorage localStorage 这些 api 。我们只需要替换掉 pinia-plugin-persistedstate 默认的储存 api 就可以了。使用 createPersistedState 重新创建一个实例, 把里面的 storage 的参数修改为对应的 uniapp

2024年02月08日
浏览(32)
阿里 P7 三面凉凉，kafka Borker 日志持久化没答上来

👏作者简介：大家好，我是爱敲代码的小黄，阿里巴巴淘天Java开发工程师，CSDN博客专家 📕系列专栏：Spring源码、Netty源码、Kafka源码、JUC源码、dubbo源码系列 🔥如果感觉博主的文章还不错的话，请👍三连支持👍一下博主哦 🍂博主正在努力完成2023计划中：以梦为马，扬帆

2024年02月04日
浏览(53)
redis如何实现持久化

RDB是一种快照存储持久化方式，具体就是将Redis某一时刻的内存数据保存到硬盘的文件当中，默认保存的文件名为dump.rdb，而在Redis服务器启动时，会重新加载dump.rdb文件的数据到内存当中恢复数据。开启RDB持久化方式很简单，客户端可以通过向Redis服务器发送save或bgsave命令让

2024年02月12日
浏览(40)
Docker数据持久化

在容器层的 UnionFS（联合文件系统）中对文件/目录的任何修改，无论是手工修改还是容器在运行过程中的修改，在该容器丢失或被删除后这些修改将全部丢失。即这些修改是无法保存下来的。若要保存下来这些修改，通常有两种方式：定制镜像持久化：将这个修改过的容器

2024年01月23日
浏览(60)
RabbitMQ-数据持久化

1、交换机持久化（SpringAMQP默认） 2、队列持久化（SpringAMQP默认） 3、消息持久化如果采用纯内存操作，那么消息存储达到队列的上限之后，会有一个page out操作，这个操作是将队列中已经有的一部分MQ消息转移到磁盘，给队列腾出空间，使得队列能够继续接收MQ消息

2024年01月21日
浏览(43)
flutter：数据持久化

保存数据到本地磁盘是应用程序常用功能之一，比如保存用户登录信息、用户配置信息等。而保存这些信息通常使用 shared_preferences ，它保存数据的形式为 Key-Value （键值对），支持 Android 和 iOS。 shared_preferences 是一个第三方插件，在 Android 中使用 SharedPreferences ，在 iOS中使用

2024年02月09日
浏览(42)
Docker容器数据持久化

Docker容器数据卷：volumes 数据卷是经过特殊设计的目录，可以绕过联合文件系统，为一个或者多个容器提供访问，数据卷设计的目的，在于数据的永久存储，它完全独立于容器的生存周期，因此，docker不会在容器删除时删除其挂载的数据卷，也不会存在类似的垃圾收集

2024年02月10日
浏览(55)