02_kafka_基本概念_基础架构

1年前作者：AntHub分类：Toy博客阅读(16)违法举报

这篇具有很好参考价值的文章主要介绍了02_kafka_基本概念_基础架构。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

常见的消息队列工作模式

至多一次：消息被确认消费后，删除消息；一般只允许被一个消费者消费，且队列中的数据不允许被重复消费。activeMQ 就是这种。
没有限制：消息可以被多个消费者同时消费，并且同一个消费者可以多次消费同一个记录；大数据场景。

基本概念

集群中的一则消息也称为 Record；
Topic 用于分类集群中的消息-record；每个topic 可以有多个订阅者。（topic 是一种逻辑上的概念）
每一个Record 只属于一个Topic；
分区日志 partition：用于持久化存储 topic 中的 record；生产者决定 record 发送到 topic 中的哪一个partition 中；
Broker：一个具体的消息服务实例；
Leader： Broker 中语言读写数据的角色
follower：同步leader 数据，leader如果宕机，用于选举新leader，来读写
集群中的 Leader 的监控和 Topic 元数据存储在 Zookeeper 中

kafka 特性

高吞吐率
海量存储

Kafka 基本架构

topic 分区的目的/ 好处

对 topic 容量的提升：属于同一个 topic 的日志分散到多个服务器扩展了单机的容量，还可以扩缩容；
提高并发/ 分流：集群中不同的服务器作为不同分区的 leader，提高 io 能力，均衡系统负载
在使用消费组时，增加分区也会增加消费能力
（每个分区需要适配托管它的服务器）

日志存储形式

每组日志分区时一个有序的不可变的日志序列，分区中的每一个Record 都被分配了唯一的序列编号称为 offset， record 会持久化；
时间越早，序号越小；
使用硬盘存储日志文件。（性能问题）
kafka 会定期检查日志文件，然后将过期的数据从log 中移除；
由于分区的存在，及写入策略的不同，kafka 只能保证单个分区的先入先出的顺序性，无法保证多个分区之间的顺序性。也就是不是严格意义上的先进先出，
所以，如果需要让kafka 保证顺序那就可以采用不分区的方式。

消费者，消费方式逻辑

每个消费者维护自己本次消费对应分区的偏移量；
由上，多个消费者之间相互独立；
消费者在消费完一个批次的数据后，将本次消费的偏移量( 实际是offset+1，是下次读取的起始位置)提交给 kafka 集群；
所以，对每个消费者而言可以随意的控制消费者的偏移量；消费者可以从一个 topic 分区中的任意位置读取数据。

消费组

消费者使用 Consumer Group 名称标记自己；
发布到Topic 的每条记录都会传递到每个消费组中的一个消费者；也就是说，一个分区上的消息还是仅由组中的一个消费者消费；
新加入组的实例，会接管其他消费者负责的某些分区（是否优先接管负载大的消费者的分区？）
组中的消费者个数一般不会大于 topic中分区的数量；多的只能作为备用
基于的是均分策略；

文章来源地址https://www.toymoban.com/news/detail-648595.html

（就是消费者的分身，是一种逻辑上的消费者，视为一个消费者；）
（提高了消费者的吞吐量，在组中的实例间均分消费）
（提高了消费者的可用性/容错性，一个消费者下线，其负责的分区将由组中的其他实例负责处理）

高性能

写入：顺序写+ mmap

mmap 内存传入 fd 直接映射文件，对应内核 PageCache；
kafka 写入 mmap 映射的内存；OS 自动刷写磁盘（数据丢失问题？#2）
顺序写入；

读取：零拷贝+DMA

零拷贝（用户空间零拷贝）：数据不经过用户空间，从内核缓冲区直接拷贝到socket 缓冲区，然后发送出去；
dma 协处理器：传统io 需要cpu 在磁盘驱动器缓冲区与内核缓冲区之间来回拷贝，过程中磁盘反复发出中断，cpu还需要反复处理中断；引入dma后 cpu 来回拷贝、中断处理的动作由dma 完成，拷贝完成后/ 数据足够多后通知cpu。期间 cpu 可以用于处理其他任务。

使用场景

解耦，异步通信，削峰填谷
大数据

到了这里，关于02_kafka_基本概念_基础架构的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Kafka的分布式架构与高可用性
一开始我们就说过Kafka是一款开源的高吞吐、分布式的消息队列系统，那么今天我们就来说下它的分布式架构和高可用性以及双/多中心部署。以下是 Kafka 的软件架构，整个 Kafka 体系结构由 Producer、Consumer、Broker、ZooKeeper 组成。Broker 又由 Topic、分区、副本组成。详细可以参
2024年02月10日
浏览(11)
【分布式和微服务1】一篇文章详细了解分布式和微服务的基本概念
🍀 通俗一点说，高可用的意思是：在高并发的情况下，系统仍然是可用的 🍀 高可用的目的：保障业务的连续性（实现在用户眼里，业务永远是正常对外提供服务的） 🍀 🍬 【上图】一个 SpringBoot 项目（ apple.jar ）被部署到服务器上运行，可向其发送网络请求对数据
2024年02月02日
浏览(14)
Git 分布式版本控制系统基本概念和操作命令
目录 Git 基本概念功能特点工作流程操作命令新建代码库配置增删文件代码提交分支标签查看信息远程同步撤销其他小结 Git 是一个开源的分布式版本控制系统，用于跟踪文件的变更历史。它最初由 Linux Torvalds 设计，用于 Linux 内核的开发，但由于其强大的功能和灵
2024年03月27日
浏览(24)
DAY-01--分布式&微服务基础概念
了解整体项目包含后端、前端、周边维护。整个项目的框架知识。 1、微服务将应用程序基于业务拆分为多个小服务，各小服务单独部署运行，采用http通信。 2、集群分布式节点集群是个物理形态，分布式是工作方式。集群：将几台
2024年02月09日
浏览(11)
阿里架构师分享分布式架构笔记文档：Nginx+Redis+ZK+Kafka+MQ等
Nginx 是一款非常优秀的开源软件，工作需要，研究了很久一段时间的 Nginx 源码，在研究学习的过程中收益颇多。作为高性能服务器的代表，为了追求极致的高性能，在许多方面，Nginx 的源码实现都可以称得上是典范。市面上真正适合学习的Nginx资料太少，有的书或资料虽然讲
2024年02月10日
浏览(8)
二、Hadoop分布式系统基础架构
分布式体系中，会存在众多服务器，会造成混乱等情况。那如何让众多服务器一起工作，高效且不出现问题呢？在大数据体系中，分布式的调度主要有2类架构模式： ~去中心化模式 ~中心化模式没有明确的中心，众多服务器之间基于特定的规则进行同步
2024年02月05日
浏览(8)
分布式事务 --- 理论基础、Seata架构、部署
本地事务，也就是传统的单机事务。在传统数据库事务中，必须要满足四个原则：分布式事务，就是指不是在单个服务或单个数据库架构下，产生的事务，例如：跨数据源的分布式事务跨服务的分布式事务综合情况在数据库水平拆分、服务垂直拆分之后，一个业
2024年02月02日
浏览(11)
聊聊分布式架构01——http通信基础
目录 web通信的简单结构网络通信基础TCP/IP TCP/IP 通信传输流 HTTP中的三剑客负责传输的IP协议确保可靠性的TCP协议 SYN攻击（SYN Flood Attack）四次挥手负责域名解析的DNS服务基于 TCP 协议实现通信 TCP 协议的通信过程 Web通信的简单结构 Web 使用一种名为 HTTP（HyperText Transfer Pr
2024年02月07日
浏览(12)
pytorch 分布式 Node/Worker/Rank等基础概念
分布式训练相关基本参数的概念如下: Definitions Node - A physical instance or a container; maps to the unit that the job manager works with. Worker - A worker in the context of distributed training. WorkerGroup - The set of workers that execute the same function (e.g. trainers). LocalWorkerGroup - A subset of the workers in the worker g
2024年02月02日
浏览(6)
Git简介与工作原理：了解Git的基本概念、版本控制系统和分布式版本控制的工作原理
🌷🍁 博主 libin9iOak带您 Go to New World.✨🍁 🦄 个人主页——libin9iOak的博客🎐 🐳 《面试题大全》文章图文并茂🦕生动形象🦖简单易学！欢迎大家来踩踩~🌺 🌊 《IDEA开发秘籍》学会IDEA常用操作，工作效率翻倍~💐 🪁🍁 希望本文能够给您带来一定的帮助🌸文章粗浅，敬
2024年02月16日
浏览(13)