大数据开发之Zookeeper

这篇具有很好参考价值的文章主要介绍了大数据开发之Zookeeper。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

第 1 章:Zookeeper 入门

1.1 概述

它负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦这些数据的状态发生变化,Zookeeper 就将负责通知这些已经在 Zookeeper 上注册的那些观察者做出相应的反应。

1.2 特点

  1. 一个领导者(Leader),多个跟随者(Follower)组成的集群。
  2. 集群中只要有半数以上的节点存活,Zookeeper 集群就能正常工作。所以 Zookeeper 适合安装奇数台服务器。
  3. 每个Server 保存一份相同的数据副本,Client 无论连接哪个 Server,数据都是一致的。
  4. 更新请求顺序执行,来自同一个 Client 的更新请求按其发送顺序依次执行。
  5. 数据更新原子性,一次数据更新要么成功,要么失败。
  6. 实时性, 在一定时间范围内,Client 能读到最新数据。

1.3 数据结构

ZooKeeper 数据模型的结构与 Unix 文件系统很类似,整体上可以看作一棵树,每个节点称为一个 ZNode。每个 ZNode 默认能够存储 1MB 的数据,每个 ZNode 都可以通过其路径唯一标识。

1.4 应用场景

统一命名服务

在分布式系统下,经常需要对应用/服务进行统一命名,便于识别。例如:IP 不容易记住,而域名容易记住。

统一配置管理

  1. 分布式环境下,配置文件同步非常常见
    1)一般要求一个集群中,所有节点的配置信息是一致的,比如 Kafka 集群。
    2)对配置文件修改后,希望能够快速同步到各个节点上。
  2. 配置文件管理可交由 ZooKeeper 实现
    1)可将配置信息写入 ZooKeeper 上的Znode。
    2)各个客户端服务器监听这个 Znode。
    3)一旦 Znode 中的数据被修改,ZooKeeper 将通知各个客户端服务器。

统一集群管理

  1. 分布式环境中,实时掌握每个节点的状态是必要的
    1) 可根据节点实时状态做一些调整。
  2. ZooKeeper 可以实现实时监控节点状态变化
    1)可将节点信息写入 ZooKeeper 上的一个 ZNode。
    2)监听这个 ZNode 可获取它的实时状态变化。

服务器动态上下线

客户端能够实时洞察到服务器上下线的变化。

软负载均衡

在 ZooKeeper 中记录每台服务器的访问数,让访问数最少的服务器去处理最新的客户端请求。

第 2 章:Zookeeper 安装

2.1 配置参数解读

Zookeeper 中的配置文件 zoo.cfg 中参数含义解读如下:
tickTime = 2000:通信心跳时间,Zookeeper 服务器与客户端心跳时间,单位毫秒。
initLimit = 10:LF 初始通信时限。Leader 和 Follower 初始连接时能容忍的最多心跳数(tickTime的数量)
syncLimit = 5:LF 同步通信时限。Leader 和 Follower 之间通信时间如果超过 syncLimit * tickTime,Leader 认为 Follower 死掉,从服务器列表中删除 Follower。
dataDir:保存 Zookeeper 中的数据。注意:默认的 tmp 目录,容易被 Linux 系统定期删除,所以一般不用默认的 tmp 目录。
clientPort = 2181:客户端连接端口,通常不做修改。

第 3 章:Zookeeper 实战(开发重点)

3.1 集群操作

3.1.1 选举机制(面试重点)

第一次启动

大数据开发之Zookeeper,大数据,zookeeper,分布式服务器1启动,发起一次选举。服务器1投自己一票。此时服务器1票数一票,不够半数以上(3票),选举无法完成,服务器1状态保持为LOOKING。
服务器2启动,再发起一次选举。服务器1和2分别投自己一票并交换选票信息:此时服务器1发现服务器2的 myid 比自己目前投票推举的(服务器1)大,更改选票为推举服务器2。此时服务器1票数0票,服务器2票数2票,没有半数以上结果,选举无法完成,服务器1,2状态保持LOOKING。
服务器3启动,发动一次选举。此时服务器1和2都会更改选票为服务器3.此次投票结果:服务器1为0票,服务器2为0票,服务器3为3票。此时服务器3的票数已经超过半数,服务器3当选 Leader。服务器1,2更改状态为FOLLOWING,服务器3更改状态为 LEADING。
服务器4启动,发起一次选举。此时服务器1,2,3已经不是LOOKING状态,不会更改选票信息。交换选票信息结果:服务器3为3票,服务器4为1票。此时服务器4服从多数,更改选票信息为服务器3,并更改状态为FOLLOWING。
服务器5启动,同4一样当小弟。

大数据开发之Zookeeper,大数据,zookeeper,分布式

SID:服务器ID。用来唯一标识一台 ZooKeeper 集群中的机器,每台机器不能重复,和 myid 一致。
ZXID:事务ID。ZXID 是一个事务 ID,用来标识一次服务器状态的变更。在某一时刻,集群中的每台机器的ZXID值不一定完全一致,这和 ZooKeeper 服务器对于客户端“更改请求”的处理逻辑有关。
Epoch:每个 Leader 任期的代号。每次 Leader 时同一轮投票过程中的逻辑时钟值是相同的。每投完一次票这个数据就会增加。
先比Epoch,再比ZXID,看谁的数据更完整。

非第一次启动

大数据开发之Zookeeper,大数据,zookeeper,分布式
当 ZooKeeper 集群中的一台服务器出现以下两种情况之一时, 就会进行Leader 选举:

  • 服务器初始化启动。
  • 服务器运行期间无法和 Leader 保持联系。

而当一台机器进入 Leader 选举流程时,当前集群也可能会处于一下两种状态:

  • 集群中本来就已经存在一个 Leader。
    对于第一种已经存在 Leader 的情况,机器试图去选举 Leader 时,会被告知当前服务器的 Leader 信息,对于该机器来说,仅仅需要和 Leader 机器建立连接,并进行状态同步即可。
  • 集群中确实不存在 Leader
    先比较 Epoch,再比较 ZXID,如果都相同,看谁的 SID 大。

3.2 客户端命令操作

3.2.1 命令行语法

命令基本语法 功能描述
help 使用 ls 命令来查看当前 znode 的子节点 [可监听] -w:监听子节点变化 -s:附加次级信息
create 普通创建 -s:含有序列 -e:临时(重启或者超时消失)
get path 获取节点的值 [可监听] -w:监听节点的内容变化 -s:附加次级信息
set 设置节点的具体值
stat 查看节点状态
delete 删除节点
deleteall 递归删除节点
  • 启动客户端
    bin/zkCli.sh -server hadoop102:2181
  • 显示所有操作命令
    help

3.2.2 znode 节点数据信息

  • 查看当前 znode 中所包含的内容
    ls /
  • 查看当前节点详细数据
    ls -s /
[zookeeper]
cZxid = 0x0:创建节点的事务。每次修改 ZooKeeper 状态都会产生一个 ZooKeeper 事务 ID。事务 ID 是 ZooKeeper 中所有修改的总的次序。每次修改都有唯一的 zxid,如果 zxid1 小于 zxid2,那么 zxid1 再 zxid2之前发生。
ctime = Thu Jan 01 08:00:00 CST 1970:znode 被创建的毫秒数(从1970年开始)
mZxid = 0x0:znode 最后更新的事务 zxid
mtime = Thu Jan 01 08:00:00 CST 1970:znode 最后修改的毫秒数(从1970年开始)
pZxid = 0x0:znode 最后更新的子节点 zxid
cversion = -1:znode 子节点变化号,znode 子节点修改次数
dataVersion = 0:znode 数据变化号
aclVersion = 0:znode 访问控制列表的变化号
ephemeralOwner = 0x0:如果是临时节点,这个是 znode 拥有者的 session id。如果不是临时节点则是0。
dataLength = 0:znode 的数据长度。
numChildren = 1:znode 子节点数量。

节点类型(持久/短暂/有序号/无序号)

大数据开发之Zookeeper,大数据,zookeeper,分布式
持久化目录节点:客户端与 Zookeeper 断开连接后,该节点依旧存在。
持久化顺序编号目录节点:客户端与 Zookeeper 断开连接后,该节点依旧存在,只是 Zookeeper 给该节点名称进行顺序编号。
临时目录节点:客户端与 Zookeeper 断开连接后,该节点被删除。
临时顺序编号目录节点:客户端与 Zookeeper 断开连接后,该节点被删除,只是 Zookeeper 给该节点名称进行顺序编号。
说明:创建 znode 时设置顺序标识,znode 名称后会附加一个值,顺序号是一个单调递增的计数器,由父节点维护。
注意:在分布式系统中,顺序号可以被用于为所有的事件进行全局排序,这样客户端可以通过顺序号推断事件的顺序。

  • 分别创建两个普通节点(永久节点 + 不带序号)
    create /sanguo “diaochan”
    create /sanguo/shuguo “liubei”
    注意:创建节点时,要赋值。
  • 获取节点的值
    get -s /sanguo
    get -s /sanguo/shuguo
  • 创建带序号的节点(永久节点 + 带序号)
    先创建一个普通根节点
    create /sanguo/weiguo “caocao”
    创建带序号的节点
    create -s /sanguo/weiguo/zhangliao “zhangliao”
    create -s /sanguo/weiguo/zhangliao “zhangliao”
    create -s /sanguo/weiguo/xuchu “xuchu”
    如果原来没有序号节点,序号从0开始依次递增。如果原节点下已有2个节点,则再排序时从2开始,依次类推。
  • 创建短暂节点(短暂节点 + 不带序号 or 带序号)
    创建短暂的不带序号的节点
    create -e /sanguo/wuguo “zhouyu”
    创建短暂的带序号的节点
    create -e -s /sanguo/wuguo “zhouyu”
    在当前客户端是能查看到的
    ls /sanguo
    退出当前客户端然后再重启客户端
    quit
    bin/zkCli.sh
    再次查看根目录下短暂节点已经删除
    ls /sanguo
  • 修改节点数据值
    set /sanguo/weiguo “simayi”

3.2.4 监听器原理

客户端注册监听它关心的目录节点,当目录节点发生变化(数据改变、节点删除、子目录节点增加删除)时,ZooKeeper 会通知客户端。监听机制保证 ZooKeeper 保存的任何的数据的任何改变都能快速的响应到监听了该节点的应用程序。
大数据开发之Zookeeper,大数据,zookeeper,分布式
1)首先要有一个main()线程
2)在main线程中创建Zookeeper客户端,这时就会创建两个线程,一个负责网络连接通信(connect),一个负责监听(listener)。
3)通过connect线程将注册的监听事件发送给Zookeeper。
4)在Zookeeper的注册监听器列表中将注册的监听事件添加到列表中。
5)Zookeeper监听到有数据或路径变化,就会将这个消息发送给listener线程。
6)listener线程内部调用了process()方法。

  • 节点的值变化监听
    在hadoop104主机上注册监听/sanguo节点数据变化
    get -w /sanguo
    在hadoop103主机上修改/sanguo节点的数据
    set /sanguo “xisi”
    观察hadoop104主机收到数据变化的监听
WATCHER::
WatchedEvent state:SyncConnected type:NodeDataChanged path:/sanguo

注意:在hadoop103再多次修改/sanguo的值,hadoop104上不会再收到监听。因为注册一次,只能监听一次。想再次监听,需要再次注册。

  • 节点的子节点变化监听(路径变化)
    在hadoop104主机上监听/sanguo节点的子节点变化
    ls -w /sanguo
    在hadoop103主机/sanguo节点上创建子节点
    create /sanguo/jin “simayi”
    观察到hadoop104主机收到子节点变化的监听
WATCHER::
WatchedEvent state:SyncConnected type:NodeChildrenChanged path:/sanguo

注意:节点的路径变化,也是注册一次,生效一次 。想多次生效,就需要多次注册。

3.2.5 节点删除与查看

  • 删除节点
    delete /sanguo/jin
  • 递归删除节点
    deleteall /sanguo/shuguo
  • 查看节点状态
    stat /sanguo

3.3 写数据流程

大数据开发之Zookeeper,大数据,zookeeper,分布式文章来源地址https://www.toymoban.com/news/detail-792570.html

到了这里,关于大数据开发之Zookeeper的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 分布式协调组件Zookeeper

    ZooKeeper 是⼀种 分布式协调组件 ,用于管理大型主机。 在分布式环境中协调和管理服务是一个复杂的过程 。ZooKeeper 通过其简单的架构和 API 解决了这个问题。ZooKeeper 允许开发人员专注于核心应用程序逻辑,而不必担心应用程序的分布式特性。 分布式协调组件 在分布式系统

    2024年02月13日
    浏览(44)
  • Zookeeper 分布式锁案例

    Zookeeper 是一个开源的分布式协调服务,可以用于维护分布式系统中的一致性、顺序性和命名等。其中,Zookeeper 的分布式锁机制可以用于实现分布式系统中的互斥访问,确保在多个节点上对共享资源进行同步访问。 Zookeeper 分布式锁的实现原理是基于 Zookeeper 的临时有序节点和

    2024年02月16日
    浏览(43)
  • Zookeeper实现分布式锁

    ZooKeeper是一个分布式协调服务,其中提供的序列化、持久化、有层次的目录结构使得它非常适合用于实现分布式锁。在ZooKeeper中,分布式锁通常通过临时有序节点实现。以下是ZooKeeper分布式锁的详细介绍:  实现方式: 临时有序节点: 当一个客户端需要获取锁时,它在ZooK

    2024年02月02日
    浏览(58)
  • zookeeper伪分布式安装

    需要有jdk1.8 (1)将zookeeper的安装包上传到/opt/modules目录下 (2)解压 (3)更名 切换到/opt/installs目录下 (4)配置环境变量 切换到/opt/installs/zookeeper3.6.3/conf目录下

    2024年02月17日
    浏览(37)
  • ZooKeeper的分布式锁

    ZooKeeper的分布式锁机制主要利用ZooKeeper的节点特性,通过创建和删除节点来实现锁的控制。 实现步骤: 创建锁节点:当一个进程需要访问共享资源时,它会在ZooKeeper中创建一个唯一的临时顺序节点作为锁。 尝试获取锁:进程会查看当前所有的锁节点,检查自己创建的节点是

    2024年04月22日
    浏览(41)
  • 分布式锁解决方案_Zookeeper实现分布式锁

    提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加 分布式锁解决方案_Zookeeper实现分布式锁 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 提示:这里可以添加本文要记录的大概内容: Zookeeper 是一个开源的分布式协调服务,它

    2024年02月03日
    浏览(42)
  • 4、Zookeeper分布式安装部署

    1、分布式安装部署 1)集群规划 在hadoop102、hadoop103和hadoop104三个节点上部署Zookeeper。 服务器hadoop102 服务器hadoop103 服务器hadoop104 Zookeeper Zookeeper Zookeeper Zookeeper 2)解压安装 (1)解压Zookeeper安装包到/opt/module/目录下  (2)修改/opt/module/apache-zookeeper-3.5.7-bin名称为zookeeper 3)配

    2024年02月12日
    浏览(51)
  • zookeeper —— 分布式服务协调框架

    Zookeeper是一个开源的分布式的,为分布式应用提供协调服务的Apache项目。 Zookeeper从设计模式角度来理解:是一个基于观察者模式设计的分布式服务管理框架,它负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦这些数据的状态发生变化,Zookeeper就将负责通知已

    2024年02月07日
    浏览(44)
  • 02-zookeeper分布式锁案例

    核心思想 :当客户端要获取锁,则创建节点,使用完锁,则删除该节点。 当我们假设根节点/ 下有/locks节点时 1)客户端获取锁时,在locks节点下创建 临时顺序 节点。 2)然后获取lock下面的所有子节点,客户端获取到所有的子节点之后,如果 发现自己创建的子节点序号最小

    2024年02月09日
    浏览(41)
  • 基于zookeeper实现分布式锁

    目录 zookeeper知识点复习 相关概念 java客户端操作 实现思路分析  基本实现 初始化链接 代码落地  优化:性能优化  实现阻塞锁 监听实现阻塞锁 优化:可重入锁 zk分布式锁小结  Zookeeper(业界简称zk)是一种提供配置管理、分布式协同以及命名的中心化服务,这些提供的 功

    2024年02月02日
    浏览(61)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包