10、Kafka ------ 消费者组 和 消费者实例,分区 和 消费者实例 之间的分配策略

这篇具有很好参考价值的文章主要介绍了10、Kafka ------ 消费者组 和 消费者实例,分区 和 消费者实例 之间的分配策略。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

消费者组 和 消费者实例


★ 消费者组

形象来说:你可以把主题内的多个分区当成多个子任务、多个子任务组成项目,每个消费者实例就相当于一个员工,假如你们 team 包含2个员工。

  项目         主题              team(2个员工)

 5个子任务      分区

 ——每个子任务只会分给一个同一team的一个员工。

同理:

同一主题下,每个分区最多只会分给同一个组内的一个消费者实例

消费者以组的名义来订阅主题,前面的 kafka-console-consumer.bat 命令可通过–group选项来指定组ID。

一个主题包含多个分区,一个消费者组也包含多个消费者实例。同一个消费者组内的所有消费者共享一个公共的ID,这个ID被称为组ID。

同一组的多个消费者实例对外表现为一个整体(group、team),消费者实例整体一组的形式订阅一个主题。

同一消费组内的多个消费者实例一起协调消费主题所包含的全部分区,

因此:

同一个主题下每个分区只能由同一个组内的一个消费者实例来消费,但一个消费者实例可负责消费多个不同的分区。

由此可以发现:

同一消费者组内,多个消费者实例绝不可能获去同一个消息主题内的相同消息——这就是典型P2P模型

不同消费者组,它们将会读到同一个消息主题内完全相同的消息,
——这就是典型Pub-Sub模型

同一组内多个消费者实例就是模拟了P2P模型。不同组内多个消费者就是模拟了Pub-Sub模型。



简单来说:
1、一个主题有多个分区,一个消费者组有多个消费者实例
2、然后这个消费者组中的消费者实例A,它消费过的分区,其他同组的消费者实例B就不能去消费了,可以避免消息被重复消费。
3、但是一个消费者实例可以消费多个主题下的不同分区。
4、不同消费者组的消费者实例,可以读取同一个主题下的同一个分区里面的消息。
10、Kafka ------ 消费者组 和 消费者实例,分区 和 消费者实例 之间的分配策略,Kafka 系列,kafka,分布式



★ 分区 和 消费者实例


理想情况下,消费者组中的消费者实例的数量恰好等于该组所订阅主题内的总分区数,这样每个消费者实例恰好负责处理一个分区。

否则还有可能出现如下两种情况:

1、消费者实例数大于所订阅主题的分区数:
一个消费者实例要负责一个分区。但会有几个消费者实例处理空闲状态。

2、消费者实例数小于所订阅主题的分区数:
此时一个消费者实例要负责多个分区。

第一种情况无非是造成了消费者实例的浪费(消费者实例也是一个进程,但它永远无事可做);

但大部分时候,通常都是上面的第二种情况,此时就需要处理为消费者实例分配分区的问题。



★ 分配分区(分区 和 消费者实例 之间的分配策略)

3种分配策略

Kafka为消费者实例分配分区时提供了3种分配策略
就是为消费者实例分配它们要消费的分区的信息。

1、range策略。

2、round-robin策略。

3、sticky策略。



★ range策略

Kafka 默认是这个 range 策略

range策略看上去是公平,但实际上并不公平。

range策略是基于【每个主题】进行单独分配的,其大致步骤如下:

1、将每个主题内分区按数字顺序进行排序,消费者则按消费者名称的字典顺序进行排序。

2、用主题内的分区总数除以消费者总数,如果恰好能除尽,则每个消费者实例都分得相同数量(就是除得的商)的分区;
如果除不尽,排在前面的几个消费者将会分得额外的分区。



如图:一开始在想,为什么不是P0给C0,P1给C1,然后P2再给C0。

其实range策略是先算主题下有几个分区,然后消费者组有几个实例,然后计算每个实例消费几个分区,然后再来分配的。

如图,在range策略计算下,C0 要消费2个分区,C1要消费1个分区,所以在分配分区的时候,就把前面两个分区分配给C0实例,然后后面一个分区就分配给C1实例。


在有多个主题的情况下,range策略也是一个主题一个主题来单独分配的,

如图:现在有两个主题,一共有6个分区,然后有两个消费者实例,按理说应该一个实例消费三个分区,但是range策略是一个主题一个主题来分配的,
所以C0 在主题T0 分配到了两个分区,在主题T1那里也分配到了两个分区,
所以最后C0实例需要消费4个分区,而C1实例只需要消费2个分区,这个是不合理的。

这样容易造成 C1 实例的资源浪费

10、Kafka ------ 消费者组 和 消费者实例,分区 和 消费者实例 之间的分配策略,Kafka 系列,kafka,分布式



★ round-robin策略 (轮询)

round-robin策略会把【所有订阅主题的所有分区】按顺序排开,然后采用轮询方式依次分给各消费者实例。

由此可见,
round-robin策略 与 range策略 最大的不同就是它不再局限于单个主题进行分配,而是将所有订阅主题作为整体来进行分配

很明显,round-robin策略要更公平一些。

10、Kafka ------ 消费者组 和 消费者实例,分区 和 消费者实例 之间的分配策略,Kafka 系列,kafka,分布式



★ stick策略

——尽量只对改动部分进行重分配,尽力维护既有的分配方案。

sticky策略 主要是为了处理重平衡(rebalance) 需求,重平衡就是重新为消费者实例分配分区的过程

比如以下三种情况就会触发重平衡:

  • 组中消费者实例的数量发生变化。 比如有新的消费者实例加入消费者组,或者有消费者实例退出了消费者组。

  • 订阅的主题数发生改变。 当消费者组以正则表达式的方式订阅主题时,符合正则表达式的主题可能会动态地变化。

  • 某个或某几个订阅主题的分区数发生改变。当主题内分区数增加时,必须为之分配消费者实例来处理它。

当触发重平衡处理时,如果使用 range 或 round-robin策略,Kafka会【彻底抛弃】原有的分配方案,对变化后的消费者实例、分区进行彻底的重新分配。

而 sticky策略 则有效地避免了上述两种策略的缺点,sticky策略 会尽力维持了之前的分配方案,只对改动部分进行最小的再分配,因此通常认为 sticky策略 在处理重平衡时具有最佳的性能。



如何指定分配分区的策略:

可以在配置文件中指定策略,也可以在代码中指定。

通过如下属性:
partition.assignment.strategy

org.apache.kafka.clients.consumer.RangeAssignor:range策略

org.apache.kafka.clients.consumer.RoundRobinAssignor: round-robin策略

org.apache.kafka.clients.consumer.StickyAssignor: stick策略

10、Kafka ------ 消费者组 和 消费者实例,分区 和 消费者实例 之间的分配策略,Kafka 系列,kafka,分布式

百度查看是这么设置的,具体待后续研究:

10、Kafka ------ 消费者组 和 消费者实例,分区 和 消费者实例 之间的分配策略,Kafka 系列,kafka,分布式文章来源地址https://www.toymoban.com/news/detail-802920.html

到了这里,关于10、Kafka ------ 消费者组 和 消费者实例,分区 和 消费者实例 之间的分配策略的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 分布式 - 消息队列Kafka:Kafka消费者的分区分配策略

    Kafka 消费者负载均衡策略? Kafka 消费者分区分配策略? 1. 环境准备 创建主题 test 有5个分区,准备 3 个消费者并进行消费,观察消费分配情况。然后再停止其中一个消费者,再次观察消费分配情况。 ① 创建主题 test,该主题有5个分区,2个副本: ② 创建3个消费者CustomConsu

    2024年02月13日
    浏览(42)
  • 【消息队列】细说Kafka消费者的分区分配和重平衡

    我们直到在性能设计中异步模式,一般要么是采用pull,要么采用push。而两种方式各有优缺点。 pull :说白了就是通过消费端进行主动拉去数据,会根据自身系统处理能力去获取消息,上有Broker系统无需关注消费端的消费能力。kafka采用pull模式 push : Broker主动推送消息到消费端

    2024年02月12日
    浏览(36)
  • Kafka3.0.0版本——消费者(分区的分配以及再平衡)

    1.1、消费者分区及消费者组的概述 一个consumer group中有多个consumer组成,一个 topic有多个partition组成。 1.2、如何确定哪个consumer来消费哪个partition的数据 Kafka有四种主流的分区分配策略: Range、RoundRobin、Sticky、CooperativeSticky。 可以通过配置参数 partition.assignment.strategy ,修改分

    2024年02月07日
    浏览(53)
  • Kafka3.0.0版本——消费者(RoundRobin分区分配策略以及再平衡)

    RoundRobin 针对集群中 所有Topic而言。 RoundRobin 轮询分区策略,是把 所有的 partition 和所有的consumer 都列出来 ,然后 按照 hashcode 进行排序 ,最后通过 轮询算法 来分配 partition 给到各个消费者。 2.1、创建带有7个分区的sixTopic主题 在 Kafka 集群控制台,创建带有7个分区的sixTopi

    2024年02月07日
    浏览(40)
  • Kafka3.0.0版本——消费者(Sticky分区分配策略以及再平衡)

    粘性分区定义:可以理解为分配的结果带有“粘性的”。即在执行一次新的分配之前,考虑上一次分配的结果,尽量少的调整分配的变动,可以节省大量的开销。 粘性分区是 Kafka 从 0.11.x 版本开始引入这种分配策略, 首先会尽量均衡的放置分区到消费者上面, 在出现同一消

    2024年02月09日
    浏览(43)
  • 【Kafka-Consumer分区分配策略】Kafka 消费者组三种分区分配策略 Range Assignor、RoundRobin Assignor、Sticky Assignor 详细解析

    1、一个 consumer group 中有多个 consumer 组成,一个 topic 有多个 partition 组成,现在的问题是,到底由哪个 consumer 来消费哪个 partition 的数据。 2、Kafka有四种主流的分区分配策略: Range、RoundRobin、Sticky、CooperativeSticky。 可以通过配置参数 partition.assignment.strategy ,修改分区的分配

    2024年02月22日
    浏览(46)
  • Kafka学习---4、消费者(分区消费、分区平衡策略、offset、漏消费和重复消费)

    1.1 Kafka消费方式 1、pull(拉)模式:consumer采用从broker中主动拉取数据。 2、push(推)模式:Kafka没有采用这种方式。因为broker决定消息发生速率,很难适应所有消费者的消费速率。例如推送的速度是50M/s,Consumer1、Consumer2就来不及处理消息。 pull模式不足之处是如果Kafka没有数

    2024年02月16日
    浏览(44)
  • 实现 Kafka 分区内消费者多线程顺序消费

    生产者在写的时候,可以指定一个 key,被分发到同一个 partition 中去,而且这个 partition 中的数据一定是有顺序的。 消费者从 partition 中取出来数据的时候,也一定是有顺序的。到这里,顺序还是没有错乱的。 但是消费者里可能会有多个线程来并发处理消息,而多个线程并发

    2024年02月07日
    浏览(39)
  • Kafka3.0.0版本——消费者(独立消费者消费某一个主题中某个分区数据案例__订阅分区)

    1.1、案例需求 创建一个独立消费者,消费firstTopic主题 0 号分区的数据,所下图所示: 1.2、案例代码 生产者往firstTopic主题 0 号分区发送数据代码 消费者消费firstTopic主题 0 分区数据代码 1.3、测试 在 IDEA 中执行消费者程序,如下图: 在 IDEA 中执行生产者程序 ,在控制台观察

    2024年02月09日
    浏览(45)
  • kafka复习:(22)一个分区只能被消费者组中的一个消费者消费吗?

    默认情况下,一个分区只能被消费者组中的一个消费者消费。但可以自定义PartitionAssignor来打破这个限制。 一、自定义PartitionAssignor. 二、定义两个消费者,给其配置上述PartitionAssignor. 在kafka创建只有一个分区的topic : study2023 创建一个生产者往study2023这个 topic发送消息: 分别

    2024年02月10日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包