什么是消息的可靠性呢,就是Kafka作为消息中间件,可以保证生产者发送过来的消息,即使在Kafka集群有节点出现宕机的情况下,也不会丢失
Kafka 是通过消息确认机制 和 副本复制机制 来保证消息可靠性的文章来源地址https://www.toymoban.com/news/detail-650429.html
什么是副本因子?什么是副本复制机制呢?
- 创建topic时,可以指定
副本因子
repilication-factor = 3
,默认是3- 表示分区的副本数,包括Leader分区副本和follower分区副本
- 副本因子不要超过broker的数量,尽量保证一个分区的副本均匀地分散在不同的broker上
- 第一个副本通过
轮询
的方式分配broker,从broker列表中随机位置开始轮询(生成一个随机数,选定第一个broker,然后开始逐个轮询broker放副本) - 副本机制主要是为了实现高可用
- Leader 副本只有一个,负责读写,其他节点都是Follower副本,
- Producer 只把消息发送到Leader分区,Follower副本负责从Leader同步数据
- 也就是说在Kafka集群内会一直存在大量数据复制过程,这也会造成Kafka一个性能瓶颈
如何判断副本是同步副本呢?
- ISR 同步副本列表 (包含Leader)
- 怎么样算同步呢
replica.lag.max.messages
默认4000条,Follower消息已经滞后Leader4000条,即踢出ISR,新版本已经取消该规则-
replica.lag.max.ms
默认10000ms, 10s内Follower 还没有向Leader发送fetch请求,即踢出ISR- 新版本只通过该规则识别有效副本
- 当Follower副本将Leader副本LEO之前的所有消息都同步时,认为该副本已经追赶上Leader副本
- 更新该副本的
lastCaughtUpTimeMs
最后拉取数据的时间戳 - ReplicaManager 副本管理器 会启动一个定时任务
- 定时任务定时监测
当前时间
与lastCaughtUpTimeMs
的差值 是否大于replica.lag.max.ms
值 - 大于即说明当前副本失效,踢出ISR
- 每条消息都带时间戳,生产者不带的话broker也会给消息生成时间戳,当查找消息时就是根据偏移了+时间戳
什么情况会导致副本失效呢?
- 卡副本(Stuck Replica) Follower副本进程卡住,一段时间内没有向Leader副本发起请求,比如Follower副本所在的broker内存满了,频繁发起Full GC,我们知道Full GC时会STW(stop the world ),啥也干不了了
- 慢副本(Slow Replica) Follower 副本进程同步过慢,网络或者IO开销过大或机器性能问题,导致Follower在一段时间内无法赶上Leader
- 刚启动副本(BootStrapping Replica) 改变副本因子,比如增加一个副本,新增副本在同步Leader数据时,也会一直处于失效状态; Follower节点由于宕机下线了,后又上线,在追赶上Leader副本之前也处于失效状态
如何保证消息的可靠性呢?
- 为了保证可靠性,可以设置确认机制
ack= all
,- Producer将消息发送给Leader
- Leader会等到ISR中所有Follower同步数据发送ack
- Leader 再commit,Leader再向Producer发送ack
- 保证生产者发送的消息实际写入所有副本
文章来源:https://www.toymoban.com/news/detail-650429.html
到了这里,关于Kafka 入门到起飞 - Kafka是怎么保证可靠性的呢的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!