nsq中diskqueue详解 - 第一篇

这篇具有很好参考价值的文章主要介绍了nsq中diskqueue详解 - 第一篇。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

 diskqueue是nsq消息持久化的核心,内容较多,故分为多篇

1. diskqueue第一篇 - 是什么,为什么需要它,整体架构图,对外接口

2. diskqueue第二篇 - 元数据文件,数据文件,启动入口,元数据文件的读写及保存

3. diskqueue第三篇 - 数据定义详解,运转核心ioloop()源码详解

4. diskqueue第四篇 - 怎么写入消息,怎么对外发送消息

5. diskqueue第五篇 - 追尾检测,错误处理,如何正常关闭

6. diskqueue第六篇 - 如何使用diskqueue

一、diskqueue是什么,为什么需要它

在nsq中消息主要存在于两种队列

一种是内存队列,内部是用go的通道实现,所以处理速度很快,缺点是一旦nsqd进程挂掉消息就真的丢失了,这让人难以接受,数据丢了不得被用户骂死?

一种是持久化队列,内部实现是把消息保存在磁盘文件中,即使nsqd进程突然挂掉或者物理服务器重启,但是文件仍然存在,只需重启nsqd进程即可,nsqd进程启动时会重新从文件中加载消息然后再进行投递。可以说,持久化队列是nsq能保证消息可靠投递的重要原因之一

贴出来源码,给大家看下nsqd中的两种队列,以Topic举例,文件在nsq/nsqd/topic.go(已加注释)

type Topic struct {
	// 省略无关代码......
	backend           BackendQueue			// 持久化队列
	memoryMsgChan     chan *Message			// 内存中的消息队列
    // 省略无关代码......
}

字段 memoryMsgChan 即内存队列,使用go语言的chan来实现,内部元素为Message,也就是消息对象

字段 backend 即持久化队列,类型为BackendQueue,是接口类型,每个人可以提供自己喜欢的实现。nsq作者为该接口实现的是diskqueue包,就是我们接下来两篇博客要详细讲的了

二、diskqueue地址

可能基于替换性考虑,也为了把diskqueue包提供给有数据持久化需求的人用,nsq作者并没有把代码嵌入到nsq中,而是把disqueue做成了一个独立的包,大家可以很方便地嵌入到自己的项目中

官方github地址为:GitHub - nsqio/go-diskqueue: A Go package providing a filesystem-backed FIFO queue

建议大家下载下来,边看博客,边看代码,这样效率更高

三、代码目录

大家先看下diskqueue的整体代码,有个感觉,如下图

nsq中diskqueue详解 - 第一篇,nsq,diskqueue,diskqueue详解,diskqueue源码,nsq的diskqueue

 整个包只有两个有用的文件,

diskqueue.go 这个文件是整个diskqueue的实现代码

diskqueue_test.go 这个文件是对diskqueue的测试代码

四、diskqueue整体实现流程

有的博客一上来直接对着源码一通讲,连diskqueue是什么,做什么用,整体实现都没讲,让人看得云里雾里,这样效果很差。为了让大家更好更快地理解diskqueue的实现,我专门画了它的架构图和实现流程,大家可以先了解下它的整体结构,如下图

nsq中diskqueue详解 - 第一篇,nsq,diskqueue,diskqueue详解,diskqueue源码,nsq的diskqueue

对上面模型图解释下:

1. diskqueue为每个队列保存一份meta文件(以.meta结尾),这个文件一共就3行,描述了队列的整体信息(第一行:总的消息数,第二行:当前读文件编号,读位置,第三行:当前写文件编号,写位置)

2. diskqueue把队列的消息保存在了一个或多个数据文件(以.dat结尾)中,单个文件写入达到最大限值就新创建一个,比如某个topic的名字为TestTopic,那么最终文件名字格式如下

TestTopic.diskqueue.000001.dat

TestTopic.diskqueue.000002.dat

TestTopic.diskqueue.000003.dat

即前面是topic的名字,最后是文件编号从1开始增加

3. 这些消息文件组成了一个单向的消息队列,前面在接收写入,后面在读取处理,处理结束的文件就删掉,这也就是为什么diskqueue可以宣称自己是FIFO的持久化队列,因为确实是队列的处理模型

4. 单个消息的格式:前面4个字节表消息体大小,后面是消息体的数据。单个文件内所有消息按数组的格式紧密排列,虽然上面图中两个消息之间有空隙,这只是方便大家看,实际是紧挨着的

5. 队列头是正在写的文件,队列尾是正在读的文件

    如果写快读慢,那文件队列长度就会一直增长

    如果写慢读快,那最终会读的位置等于写的位置,像汽车追尾一样

6. nsq给每个消息文件限制最大为100M,但也有可能写入了99.97M的时候,再尝试写消息时发现若写了就超过文件最大限制,这个时候只能新创建文件,旧文件最终只保存了99.97M的数据。所以一个文件最终可读多少字节,要以文件的实际大小为准

五、接口介绍

diskqueue的对外接口没几个,我用的代码取自官方github,日期2023/08/08,如下(已添加注释)

// 持久化队列的所有接口,在nsq中该接口名为BackendQueue,下面的diskQueue会实现这些接口
type Interface interface {
	Put([]byte) error			// 向队列中存一个消息
	ReadChan() <-chan []byte 	// 获取一个无缓冲的只读通道(真正弹出了消息),外部使用者可以多协程读取处理
	PeekChan() <-chan []byte 	// 获取一个无缓冲的只读通道(本通道仅查看,并不算弹出消息),外部使用者可以多协程读取处理
	Close() error			 	// 关闭队列(退出,有保存数据)
	Delete() error				// 删除队列(退出,无保存数据,注意本函数并不是真正删除消息或文件,仅仅是退出。所以想真正删除数据时需先调用Empty()再调用Delete())
	Depth() int64				// 当前未处理的消息数
	Empty() error				// 清空队列(删除所有文件)
}

一共只有7个函数,我已经写了详细的注释,这里介绍下几个特别要注意的:

Put()             :        新写进一个消息,立刻有结果

ReadChan()  :        获取只读通道,只要还有消息,就能从该通道读消息,没有消息时该通道为nil

Empty()        :        清空队列

Delete()        :        无保存退出,并非真正的删除,函数名有点坑人啊

特别切记:如果想删除某个队列,必须先调用Empty()再调用Delete()

nsq中就是这样做的,无论是删除topic还是删除channel,对于持久化队列的处理都是先调用Empty()再调用Delete()

redis代码举例:删除topic时会调用Delete()函数,如下(已添加注释)

// 删除topic的处理(先清空所有队列,channel中的队列,再执行删除)
func (t *Topic) Delete() error {
	return t.exit(true)
}

也就是调用了t.exit()函数,exit()如下(已添加注释)

// topic删除/关闭的处理
// deleted	:	true表删除topic,false表nsqd正常关闭
func (t *Topic) exit(deleted bool) error {
	// 省略无关代码......
	// 删除topic
	if deleted {
		t.Lock()
		for _, channel := range t.channelMap { // 删除本topic下的所有channel
			delete(t.channelMap, channel.name)
			channel.Delete()
		}
		t.Unlock()
		// 清空队列(内存队列,调用bckend.Empty())
		t.Empty()
		return t.backend.Delete() // 再删除持久化队列
	}
    // 省略无关代码......
}

可以看到exit()函数中判断deleted为true时,

1. 对该topic下的所有channel执行Delete()

2. 再执行Empty(),该函数会对持久化队列backend执行Empty()

3. 最后对backend执行Delete()

所以大家要谨记:如果想删除某个队列,必须先调用Empty()再调用Delete()

好了,这篇博客大家先对diskqueue有个整体印象,了解其实现原理。下一篇博客我们会从源码角度进行分析diskqueue是如何实现的,它是怎么维持FIFO队列的,有哪些要注意的点等等

diskqueue的元数据文件,数据文件,启动入口,元数据文件读写和保存_YZF_Kevin的博客-CSDN博客文章来源地址https://www.toymoban.com/news/detail-648567.html

到了这里,关于nsq中diskqueue详解 - 第一篇的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Hadoop生态圈实战系列:第一篇 Hadoop 集群安装及使用详解

    作者:禅与计算机程序设计艺术 Apache Hadoop 是一款开源的、分布式文件系统和计算平台。它由 Apache 基金会开发,并于 2011 年成为 Apache 顶级项目之一。Hadoop 的主要特性包括: 分布式存储: Hadoop 允许将数据存储在多个服务器上,在同一个集群中,并提供高容错性和可靠性。

    2024年02月08日
    浏览(47)
  • 图详解第一篇:图的基本概念及其存储结构(邻接矩阵和邻接表)

    这篇文章开始,我们来学习一种高阶数据结构——图 图是由顶点集合及顶点间的关系(边)组成的一种数据结构:G = (V, E)。 其中: 顶点集合V = {x|x属于某个数据对象集}是有穷非空集合; E = {(x,y)|x,y属于V}或者E = {x, y|x,y属于V Path(x, y)}是顶点间关系的有穷集合,也叫做边的集

    2024年02月08日
    浏览(42)
  • nsq整体架构及各个部件作用详解

    文章目录         前言         nsq的整体架构图         部件:nsqd         部件:nsqlookupd         部件:nsq连接库         部件:nsqadmin  前言 上两篇博客 centos环境搭建nsq单点_YZF_Kevin的博客-CSDN博客 linux环境搭建nsq集群_YZF_Kevin的博客-CSDN博客 我们讲了

    2024年02月15日
    浏览(35)
  • 【云原生监控系列第一篇】一文详解Prometheus普罗米修斯监控系统(山前前后各有风景,有风无风都很自由)

    zabbix是传统的监控系统,出现比云原生早,使用的是SQL关系型数据库;而Prometheus基于谷歌的borgemon使用go语言开发,使用TSDB数据库,所以支持云原生。zabbix最新发布的6.0版本,知道自己处于生死存亡时刻,也支持了Prometheus使用的TSDB数据库。 Prometheus 是一个开源的服务监控系

    2024年02月03日
    浏览(43)
  • GRBL源码详解步进电机的算法学习笔记(STM32)一篇带你学完GRBL算法初版

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 GRBL源码中步进电机的算法学习笔记(STM32) GRBL源码中算法部分的学习是我在公司研发激光切割机(三轴)期间研究的一套关于步进电机驱动控制的常见算法,以下内容都以激光切割机来举例,话不多说

    2024年02月04日
    浏览(54)
  • 单元测试spcok第一篇

    简单案例第一篇 https://tech.meituan.com/2021/08/06/spock-practice-in-meituan.html SpockRunner和Sputnik该如何选择? Sputnik和SpockRunner都是Spock框架中的类,用于运行Spock测试。 在早期的Spock版本中,测试运行器的类名是SpockRunner。但在后来的版本中,这个类被重命名为Sputnik。 因此,Sputnik和Spo

    2024年02月03日
    浏览(36)
  • ElasticSearch篇---第一篇

    前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站,这篇文章男女通用,看懂了就去分享给你的码吧。 首先说分词是给检索用的。 英文:一个单词一个词,很简单。I am a student,词与词之间空格分隔。 中文:我是学

    2024年02月04日
    浏览(38)
  • Eureka-第一篇

    ​ 一、Eureka的概述 Eureka的基本概念和作用 Eureka是一个基于REST的服务,主要用于定位运行在AWS域中的中间层服务,以达到负载均衡和中间层服务故障转移的目的。Eureka是Netflix开发的服务发现框架,主要用于解决在云计算环境中动态位置服务和快速弹性变化的问题。在微服务

    2024年01月24日
    浏览(46)
  • Mysql随心记--第一篇

    MylSAM:查询速度快,有较好的索引优化和数据压缩技术,但是它不支持事务 InnoDB:它支持事务,并且提供行级的锁定,应用也相当广泛 查看linux中创建了多少个docker容器下的mysql(只查看当前运行的去掉-a) 启动容器下的mysql 设置容器下的mysql自启动--restart always 使用该命令进

    2024年02月14日
    浏览(35)
  • FFmpeg<第一篇>:环境配置

    1、官网地址 2、linux下载ffmpeg 3、FFmpeg ./configure编译参数汇总 解压 ffmpeg-snapshot.tar.bz2 之后,在根目录下有配置文件:configure,执行该文件可以生成Makefile,configure文件中记录了configure的编译参数。 【1】Help options 帮助选项 【2】 Standard options 标准选项 【3】Licensing options 证书选

    2024年02月11日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包