Kafka的零拷贝技术Zero-Copy

这篇具有很好参考价值的文章主要介绍了Kafka的零拷贝技术Zero-Copy。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

传统的拷贝过程

Kafka的零拷贝技术Zero-Copy

流程步骤:
(1)操作系统将数据从磁盘文件中读取到内核空间的页面缓存;
(2)应用程序将数据从内核空间读入用户空间缓冲区;
(3)应用程序将读到数据写回内核空间并放入socket缓冲区;
(4)操作系统将数据从socket缓冲区复制到网卡接口,此时数据才能通过网络发送。

read/write 属于系统调用 syscall,每一次系统调用 ,发生两次上下文切换

此过程涉及到4次上下文切换以及4次数据的复制,但是这些过程中cpu数据完全没有进行变化,仅仅是磁盘数据复制到了网卡的缓冲区,在这种情况下,如果去掉流程2和3,减少用户空间和内核空间之间的切换,虽然减少了数据交换的次数,但是仍然存在数据多次复制的情况。

:步骤1和4的数据传输是通过DMA引擎进行拷贝的
步骤2和3的数据传输是通过cpu进行拷贝的**

零拷贝技术

在DMA技术的基础上,可以实现绝对的零拷贝,DMA技术为(Direct Memory Access,直接存储器访问),不需要依赖cpu的大量中断负载,数据文件可以直接绕过CPU在各个层之间传输,外围设备可以直接通过DMA控制器访问内存。通过零拷贝技术,可以减去没有必要的数据复制操作,同时也减少了上下文切换的次数。

可以看出,零拷贝技术只需要将数据从硬盘中将磁盘文件数据复制到页面缓存一次,然后直接将数据才从页面缓存直接发送到网络中,避免了重复复制的操作

页面缓存:存储磁盘数据的内核缓存区域,是操作系统内核中的一部分,用于缓存从磁盘读取的数据,以提高文件系统的性能;由物理内存中的页面构成的,每个页面的大小通常为4KB或更大。当内核从磁盘读取数据时,它将数据存储在页面缓存中。如果其他进程需要访问相同的数据,内核可以直接从页面缓存中读取,而无需再次从磁盘读取数据,从而提高了读取性能。在零拷贝技术中,页面缓存是实现数据传输的一部分。当数据需要从磁盘传输到网络或其他设备时,内核可以直接将页面缓存中的数据发送到目标设备,而无需将数据复制到用户空间或其他中间缓冲区。这样可以减少数据复制的次数和数据传输的延迟,提高数据传输的效率。

Java采用的零拷贝技术TransferTo方法底层也是调用sendfile(),Kafka的零拷贝技术可以直接将直接从它被调用的通道上传输到另一个可写字节通道,数据无需流经用户空间的应用程序;在Linux系统中零拷贝是基于sendfile()系统调用实现的,sendfile()实现的是读到内核空间的数据转到socket buffer,最后复制到协议引擎。

点击查看代码
mmap和sendfile都是零拷贝的实现方案,只不过不同的场景使用不同的方案;
mmap其实本质就是物理上磁盘文件的地址和页面缓存的地址进行映射,完成映射后对物理内存的操作会同步到硬盘上,用户通过修改内存就可以修改磁盘文件。Kafka生产的数据持久化到Broker里采用的是**mmap**文件映射的方式,实现顺序的快速写入
sendfile就是将读到内核空间的数据转到Socket Buffer,最后复制到协议引擎,相较于mmap又节省了一次cpu拷贝;
消费者从 broker 读取数据,采用sendfile,将磁盘文件读到内核缓冲区后,直接转到socket buffer进行网络发送

Kafka的零拷贝技术Zero-Copy文章来源地址https://www.toymoban.com/news/detail-709787.html

到了这里,关于Kafka的零拷贝技术Zero-Copy的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 知物由学 | “群控软件”助长黑灰产套利的零和游戏,硬核技术打击隐秘的不公

    导读:群控系统一般由多个部分组成,例如在手机端运行的服务、在手机端用于模拟输入的输入法、在 PC 端用来对所有设备操作与监控的中控台、在服务器中运行的连接所有设备的服务端等。本文主要介绍对群控软件技术的相关研究与实践。 文|李伊洋 网易易盾 Android 安全

    2024年02月11日
    浏览(35)
  • 深入理解零拷贝技术

    注意事项:除了 Direct I/O,与磁盘相关的文件读写操作都有使用到 page cache 技术。 很多应用程序在面临客户端请求时,可以等价为进行如下的系统调用: File.read(file, buf, len); Socket.send(socket, buf, len); 例如消息中间件 Kafka 就是这个应用场景,从磁盘中读取一批消息后原封不动地

    2024年02月10日
    浏览(26)
  • 聊聊transformers库; 微软推出ZeRO++技术:优化大型AI模型训练时间和成本

    🦉 AI新闻 🚀 微软推出ZeRO++技术:优化大型AI模型训练时间和成本 摘要 :据报道,微软研究人员最近发布了一项名为ZeRO++的新技术,旨在优化训练大型AI模型时常遇到的数据传输成本和带宽限制问题,可大幅减少训练时间和成本。ZeRO++建立在现有的ZeRO传输技术基础上,并通

    2024年02月13日
    浏览(42)
  • Linux-I/O机制-零拷贝技术

            外设(磁盘)-- 内核缓冲区 -- 用户缓冲区         外设(磁盘)数据到内核的这个过程解放了CPU,CPU只需要给信号到DMA控制器即可,DMA自动完成数据拷贝然后触发中断通知CPU。 传输方向: 1)外设到内存(例如:ADC) 2)内存到外设(例如:串口发送) 3)内

    2024年02月10日
    浏览(27)
  • 零拷贝技术:减少数据复制和上下文切换,提高网络传输效率(下)

    在前一章节中,我们了解了DMA技术在文件传输中的重要性,并简要介绍了零拷贝技术。为了提高文件传输的性能,我们需要减少用户态与内核态之间的上下文切换次数以及内存拷贝次数。本章将深入探讨零拷贝技术的优化方法,让我们一起走进零拷贝的优化之路! 当我们意识

    2024年02月08日
    浏览(43)
  • 零拷贝技术:减少数据复制和上下文切换,提高网络传输效率(上)

    当涉及到网络传输中的零拷贝技术时,它在提高性能和效率方面扮演着重要的角色。在之前我们已经讨论了磁盘设备管理中的零拷贝技术,其中涉及到了DMA技术。现在,让我们来深入探讨一下网络传输中零拷贝技术的实现方式以及它的重要性。 在没有DMA(直接内存访问)技术

    2024年02月08日
    浏览(33)
  • H.266/VVC SCC技术学习:帧内块拷贝(Intra block copy, IBC)

    帧内块拷贝 (Intra block copy, IBC) 是 HEVC 针对屏幕内容编码(Screen content coding)序列的扩展工具,它显着提高了屏幕内容序列的编码效率。 IBC 是一种块级编码模式, IBC 编码的 CU 被视为除帧内或帧间预测模式之外的第三预测模式。和帧间技术类似,编码端执行运动搜索( 块匹

    2023年04月22日
    浏览(19)
  • 马云说的AI电商真的要来了?AR技术虚拟试穿公司ZERO10引入AI人工智能模型,未来试衣间就应这样!

    ZERO10 是一家提供虚拟试穿体验的公司,他们基于自家的 AR 技术,提供高度逼真且顶尖的虚拟试穿体验。与现有的技术不同,他们的生成式人工智能试穿技术只需要 1-5 张用户照片,就可以实现虚拟试穿。这种方法为规模化应用提供了巨大机会。 虚拟试穿的问题可以看作是生

    2024年02月03日
    浏览(44)
  • 理解Go中的零值

    在 Go 语言中,零值(Zero Value)是指在声明变量但没有显式赋值的情况下,变量会被自动赋予一个默认值。这个默认值取决于变量的类型,不同类型的变量会有不同的零值。零值是 Go 语言中的一个重要概念,因为它确保了变量在声明后具有一个可预测的初始状态,减少了未初

    2024年02月05日
    浏览(39)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包