zookeeper最基础教程

这篇具有很好参考价值的文章主要介绍了zookeeper最基础教程。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


一、简介

1、工作机制

官方地址:https://zookeeper.apache.org/

Zookeeper是一个开源的分布式的,为分布式框架提供协调服务的Apache项目。

  • Zookeeper从设计模式角度来理解:是一个基于观察者模式设计的分布式服务管理框架,它负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦这些数据的状态发生变化,Zookeeper就将负责通知已经在Zookeeper上注册的那些观察者做出相应的反应。

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

2、特点

  • Zookeeper:一个领导者(Leader),多个跟随者(Follower)组成的集群。
  • 集群中只要有半数以上节点存活,Zookeeper集群就能正常服务。所以Zookeeper适合安装奇数台服务器。
  • 全局数据一致:每个Server保存一份相同的数据副本,Client无论连接到哪个Server,数据都是一致的。
  • 更新请求顺序执行,来自同一个Client的更新请求按其发送顺序依次执行。
  • 数据更新原子性,一次数据更新要么成功,要么失败。
  • 实时性,在一定时间范围内,Client能读到最新数据。

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

3、数据结构

  • ZooKeeper数据模型的结构与Unix文件系统很类似。
  • 整体上可以看作是一棵树,每个节点称做一个ZNode。
  • 每一个ZNode默认能够存储1MB的数据,每个ZNode都可以通过其路径唯一标识。

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

4、应用场景

提供的服务包括:统一命名服务、统一配置管理、统一集群管理、服务器节点动态上下线、软负载均衡等。

  • 统一命名服务
  • 统一配置管理
  • 统一集群管理
  • 服务器节点动态上下线
  • 软负载均衡等

统一命名服务

  • 在分布式环境下,经常需要对应用/服务进行统一命名,便于识别。例如:IP不容易记住,而域名容易记住。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

统一配置管理

  • 分布式环境下,配置文件同步非常常见。

    • 一般要求一个集群中,所有节点的配置信息是一致的,比如 Kafka 集群。
    • 对配置文件修改后,希望能够快速同步到各个节点上。
  • 配置管理可交由ZooKeeper实现。

    • 可将配置信息写入ZooKeeper上的一个Znode。
    • 各个客户端服务器监听这个Znode。
    • 一旦Znode中的数据被修改,ZooKeeper将通知各个客户端服务器。

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

统一集群管理

  • 分布式环境中,实时掌握每个节点的状态是必要的。
    • 可根据节点实时状态做出一些调整。
  • ZooKeeper可以实现实时监控节点状态变化。
    • 可将节点信息写入ZooKeeper上的一个ZNode。
    • 监听这个ZNode可获取它的实时状态变化。

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

服务器动态上下线

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

软负载均衡

  • 在Zookeeper中记录每台服务器的访问数,让访问数最少的服务器去处理最新的客户端请求。

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

5、选举机制

首次启动

  • 1)服务器1启动,发起一次选举。服务器1投自己一票。此时服务器1票数一票,不够半数以上(3票),选举无法完成,服务器1状态保持为LOOKING;
  • 2)服务器2启动,再发起一次选举。服务器1和2分别投自己一票并交换选票信息:此时服务器1发现服务器2的myid比自己目前投票推举的(服务器1)大,更改选票为推举服务器2。此时服务器1票数0票,服务器2票数2票,没有半数以上结果,选举无法完成,服务器1,2状态保持LOOKING。
  • 3)服务器3启动,发起一次选举。此时服务器1和2都会更改选票为服务器3。此次投票结果:服务器1为0票,服务器2为0票,服务器3为3票。此时服务器3的票数已经超过半数,服务器3当选Leader。服务器1,2更改状态为FOLLOWING,服务器3更改状态为LEADING;
  • 4)服务器4启动,发起一次选举。此时服务器1,2,3已经不是LOOKING状态,不会更改选票信息。交换选票信息结果:服务器3为3票,服务器4为1票。此时服务器4服从多数,更改选票信息为服务器3,并更改状态为FOLLOWING;
  • 5)服务器5启动,同4一样当小弟。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

非第一次启动

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

二、软件安装

# The number of milliseconds of each tick
# 通信心跳时间,Zookeeper服务器与客户端心跳时间,单位毫秒
tickTime=2000d

# The number of ticks that the initial 
# synchronization phase can take
# LF初始通信时限
initLimit=10

# The number of ticks that can pass between 
# sending a request and getting an acknowledgement
# LF同步通信时限
syncLimit=5

# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just 
# example sakes.
#dataDir=/tmp/zookeeper
# 保存Zookeeper中的数据
dataDir=/opt/module/zookeeper-3.5.7/zkData

# the port at which the clients will connect
#客户端连接端口,通常不做修改
clientPort=2181

1、单机版安装

安装JDK(首先需要安装JDK)

yum install java-1.8.0-openjdk-devel.x86_64 

创建文件/opt/module

mkdir /opt/module
cd /opt/module

下载文件

wget https://archive.apache.org/dist/zookeeper/zookeeper-3.5.7/apache-zookeeper-3.5.7-bin.tar.gz

解压文件

tar -zxvf apache-zookeeper-3.5.7-bin.tar.gz -C /opt/module

修改安装目录名

mv apache-zookeeper-3.5.7-bin zookeeper-3.5.7

配置环境变量

vim /etc/profile.d/my_env.sh

# ZOOKEEPER_HOME
export ZOOKEEPER_HOME=/opt/module/zookeeper-3.5.7
export PATH=$PATH:$ZOOKEEPER_HOME/bin

加载环境变量

source /etc/profile

添加配置文件

cd /opt/module/zookeeper-3.5.7/conf/
mv zoo_sample.cfg zoo.cfg

修改配置文件

vim zoo.cfg
#	修改数据所在文件
dataDir=/opt/module/zookeeper-3.5.7/zkData

创建日志目录

mkdir /opt/module/zookeeper-3.5.7/zkData

启动zookeeper

bin/zkServer.sh start

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

查询启动状态

# 查看进程
jps
# 查看状态
bin/zkServer.sh status

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

启动客户端

bin/zkCli.sh

退出客户端

quit

停止zookeeper

bin/zkServer.sh stop

2、集群安装

安装JDK(首先需要安装JDK)

yum install java-1.8.0-openjdk-devel.x86_64 

创建文件/opt/module

mkdir /opt/module
cd /opt/module

下载文件

wget https://archive.apache.org/dist/zookeeper/zookeeper-3.5.7/apache-zookeeper-3.5.7-bin.tar.gz

解压文件

tar -zxvf apache-zookeeper-3.5.7-bin.tar.gz -C /opt/module

修改安装目录名

cd /opt/module
mv apache-zookeeper-3.5.7-bin zookeeper-3.5.7

创建数据存储目录

cd /opt/module/zookeeper-3.5.7/
mkdir zkData

/opt/module/zookeeper-3.5.7/zkData目录下创建一个myid的文件

在文件中添加与server对应的编号(注意:上下不要有空行,左右不要有空格)

cd /opt/module/zookeeper-3.5.7/zkData
vim myid
#	服务器编号,每台服务器要不同
1

配置zoo.cfg配置文件

cd /opt/module/zookeeper-3.5.7/conf
mv zoo_sample.cfg zoo.cfg

修改配置文件

vim /opt/module/zookeeper-3.5.7/conf/zoo.cfg

#	修改数据存储位置
dataDir=/opt/module/zookeeper-3.5.7/zkData

# 增加集群配置
#######################cluster##########################
server.1=hadoop101:2888:3888
server.2=hadoop102:2888:3888
server.3=hadoop103:2888:3888

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

启动集群(3台都要启动)

cd /opt/module/zookeeper-3.5.7
bin/zkServer.sh start

查看状态

bin/zkServer.sh status

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

3、配置参数解读(zoo.cfg)

Zookeeper中的配置文件zoo.cfg中参数含义解读如下:

# 通信心跳时间
tickTime=2000
# LF初始通信时限
initLimit=10
# LF同步通信时限
syncLimit=5
# 保存Zookeeper中的数据
dataDir=/tmp/zookeeper
# 客户端连接端口,通常不做修改
clientPort=2181
  • tickTime = 2000:通信心跳时间,Zookeeper服务器与客户端心跳时间,单位毫秒

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

  • initLimit = 10:LF初始通信时限

Leader和Follower初始连接时能容忍的最多心跳数(tickTime的数量)

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

  • syncLimit = 5:LF同步通信时限

Leader和Follower之间通信时间如果超过syncLimit * tickTime,Leader认为Follwer死掉,从服务器列表中删除Follwer。

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

  • dataDir:保存Zookeeper中的数据

注意:默认的tmp目录,容易被Linux系统定期删除,所以一般不用默认的tmp目录。

  • clientPort = 2181:客户端连接端口,通常不做修改。

4、ZK集群启动脚本

#!/bin/bash

case $1 in
"start"){
	for i in hadoop102 hadoop103 hadoop104
	do
        echo ---------- zookeeper $i 启动 ------------
		ssh $i "/opt/module/zookeeper-3.5.7/bin/zkServer.sh start"
	done
};;
"stop"){
	for i in hadoop102 hadoop103 hadoop104
	do
        echo ---------- zookeeper $i 停止 ------------    
		ssh $i "/opt/module/zookeeper-3.5.7/bin/zkServer.sh stop"
	done
};;
"status"){
	for i in hadoop102 hadoop103 hadoop104
	do
        echo ---------- zookeeper $i 状态 ------------    
		ssh $i "/opt/module/zookeeper-3.5.7/bin/zkServer.sh status"
	done
};;
esac

三、命令行操作

1、语法

命令基本语法 功能描述
help 显示所有操作命令
ls path 使用 ls 命令来查看当前znode的子节点 [可监听]-w 监听子节点变化-s 附加次级信息
create 普通创建-s 含有序列-e 临时(重启或者超时消失)
get path 获得节点的值 [可监听]-w 监听节点内容变化-s 附加次级信息
set 设置节点的具体值
stat 查看节点状态
delete 删除节点
deleteall 递归删除节点

2、使用

启动客户端

bin/zkCli.sh -server hadoop101:2181

显示所有操作命令

help

查看当前znode中所包含的内容

ls /

查看当前节点详细数据

ls -s /
  • czxid:创建节点的事务zxid
    • 每次修改ZooKeeper状态都会产生一个ZooKeeper事务ID。事务ID是ZooKeeper中所有修改总的次序。每次修改都有唯一的zxid,如果zxid1小于zxid2,那么zxid1在zxid2之前发生。
  • ctime:znode被创建的毫秒数(从1970年开始)
  • mzxid:znode最后更新的事务zxid
  • mtime:znode最后修改的毫秒数(从1970年开始)
  • pZxid:znode最后更新的子节点zxid
  • cversion:znode子节点变化号,znode子节点修改次数
  • dataversion:znode数据变化号
  • aclVersion:znode访问控制列表的变化号
  • ephemeralOwner:如果是临时节点,这个是znode拥有者的session id。如果不是临时节点则是0。
  • dataLength:znode的数据长度
  • numChildren:znode子节点数量

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

3、节点相关

节点可以分为持久节点、短暂节点。

  • 持久(Persistent):客户端和服务器端断开连接后,创建的节点不删除。
    • 持久化目录节点客户端与Zookeeper断开连接后,该节点依旧存在
    • 持久化顺序编号目录节点客户端与Zookeeper断开连接后,该节点依旧存在,只是Zookeeper给该节点名称进行顺序编号
  • 短暂(Ephemeral):客户端和服务器端断开连接后,创建的节点自己删除。
    • 临时目录节点客户端与Zookeeper断开连接后,该节点被删除。
    • 临时顺序编号目录节点客户端与Zookeeper断开连接后,该节点被删除,只是Zookeeper给该节点名称进行顺序编号。

说明:创建znode时设置顺序标识,znode名称后会附加一个值,顺序号是一个单调递增的计数器,由父节点维护。

注意:在分布式系统中,顺序号可以被用于为所有的事件进行全局排序,这样客户端可以通过顺序号推断事件的顺序。

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

分别创建2个普通节点(创建节点时,要赋值)

create /sanguo "diaochan"
create /sanguo/shuguo "liubei"

获取子节点

ls /sanguo

获取sanguo的值

get -s /sanguo

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

  • 普通节点:create /test/test1 "zhansan01"
  • 带序号节点:create -s /test/test1 "zhansan01":创建的节点带序号test1000001
  • 短暂节点:create -e /test/test1 "zhansan01":关闭客户端后会消失(临时)

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

创建普通节点

create /test/test1 "zhansan01"

创建带序号节点

create -s /test/test2/test21 "zhansan02"
create -s /test/test2/test22 "lisi02"
create -s /test/test2/test23 "wangwu02"

创建短暂节点(关闭客户端后消失)

create -e /test/test3 "zhansan03"
#	创建短暂的带序号的节点
create -e -s /test/test3 "lisi03"

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

修改节点的值

set /test/test3 "wangwu03"

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

4、监听器原理

客户端注册监听它关心的目录节点,当目录节点发生变化(数据改变、节点删除、子目录节点增加删除)时,ZooKeeper会通知客户端。监听机制保证ZooKeeper保存的任何的数据的任何改变都能快速的响应到监听了该节点的应用程序。

监听原理

  • 1)首先要有一个main()线程
  • 2)在main线程中创建Zookeeper客户端,这时就会创建两个线程,一个负责网络连接通信(connet),一个负责监听(listener)。
  • 3)通过connect线程将注册的监听事件发送给Zookeeper。
  • 4)在Zookeeper的注册监听器列表中将注册的监听事件添加到列表中。
  • 5)Zookeeper监听到有数据或路径变化,就会将这个消息发送给listener线程。
  • 6)listener线程内部调用了process()方法。

常见的监听

#监听节点数据的变化
get path [watch]
# 监听子节点增减的变化
ls path [watch]

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

监控/test值变化

get -w /test
#	更新/test值
set /test "zhangsan"

注意:在hadoop103再多次修改/sanguo的值,hadoop104上不会再收到监听。因为注册一次,只能监听一次。想再次监听,需要再次注册。

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

监控子目录变化

ls -w /test
#	新建子目录值
create /test/test4 "zhangsan04"

注意:节点的路径变化,也是注册一次,生效一次。想多次生效,就需要多次注册。

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

5、节点删除与查看

删除节点

delete /test/test4

递归删除节点

deleteall /test/test2

查看节点状态

stat /test

zookeeper最基础教程,大数据,zookeeper,分布式,云原生

三、写数据流程

zookeeper最基础教程,大数据,zookeeper,分布式,云原生文章来源地址https://www.toymoban.com/news/detail-755988.html

到了这里,关于zookeeper最基础教程的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • golang/云原生/Docker/DevOps/K8S/持续 集成/分布式/etcd 教程

    3-6个月帮助学员掌握golang后端开发岗位必备技术点 教程时长: 150+小时 五大核心专栏,原理+源码+案例分析+项目实战直击工作岗位 golang:解决go语言编程问题 工程组件:解决golang工程化问题 分布式中间件:解决技术栈单一及分布式开发问题 云原生:解决云原生分布式部署及监

    2024年02月07日
    浏览(70)
  • 云原生可观测框架 OpenTelemetry 基础知识(架构/分布式追踪/指标/日志/采样/收集器)...

    OpenTelemetry 是一个开源的可观测性框架,由云原生基金会(CNCF)托管。它是 OpenCensus 和 OpenTracing 项目的合并。旨在为所有类型的可观测信号(如跟踪、指标和日志)提供单一标准。 https://opentelemetry.io https://www.cncf.io https://opencensus.io OpenTelemetry 指定了如何收集遥测数据并将其发送到

    2024年01月16日
    浏览(54)
  • Java中利用Redis,ZooKeeper,数据库等实现分布式锁(遥遥领先)

    1.1 什么是分布式锁 在我们进行单机应用开发涉及并发同步的时候,我们往往采用synchronized或者ReentrantLock的方式来解决多线程间的代码同步问题。但是当我们的应用是在分布式集群工作的情况下,那么就需要一种更加高级的锁机制,来处理种跨机器的进程之间的数据同步问题

    2024年02月03日
    浏览(47)
  • 云原生分布式多模架构:华为云多模数据库 GeminiDB 架构与应用实践

    在本文中我们联合华为云 NoSQL 数据库研发总监余汶龙,与您一起探讨华为云多模数据库 GeminiDB 的技术架构,以及它们如何革新当代应用的数据处理方式,内容包括介绍云原生分布式多模架构,四种数据模型接口及其竞争力特性,GeminiDB 的应用场景:游戏、监控、智慧生活、

    2024年01月21日
    浏览(48)
  • 在Spring中,可以使用不同的方式来实现分布式锁,例如基于数据库、Redis、ZooKeeper等

    在Spring中,可以使用不同的方式来实现分布式锁,例如基于数据库、Redis、ZooKeeper等。下面是两种常见的实现方式: 使用Redis实现分布式锁: 使用自定义注解实现本地锁: 以上是两种常见的在Spring中实现分布式锁的方式。第一种方式使用Redis作为分布式锁的存储介质,通过

    2024年03月17日
    浏览(41)
  • 【大数据】Hadoop-3.3.4完全分布式安装(包含VMware16和Ubuntu22的下载安装及配置)、搭建、配置教程,以及Hadoop基础简介

    注:本篇文章主要涉及到: HDFS (分布式文件系统)、 YARN (资源管理和调度框架)、以及 MapReduce (离线计算)。 以下就是本篇文章所采用的的架构 。 (1)HDFS架构简述 HDFS架构图 注:上述的master、slave1、slave2均是主机名(结点名),可以和本篇文章不一致,但下面所有涉

    2023年04月17日
    浏览(95)
  • OceanBase X Flink 基于原生分布式数据库构建实时计算解决方案

    摘要:本文整理自 OceanBase 架构师周跃跃,在 Flink Forward Asia 2022 实时湖仓专场的分享。本篇内容主要分为四个部分: 分布式数据库 OceanBase 关键技术解读 生态对接以及典型应用场景 OceanBase X Flink 在游戏行业实践 未来展望 点击查看原文视频 演讲PPT 作为一款历经 12 年的纯自研

    2024年02月13日
    浏览(38)
  • 分布式锁解决方案_Zookeeper实现分布式锁

    提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加 分布式锁解决方案_Zookeeper实现分布式锁 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 提示:这里可以添加本文要记录的大概内容: Zookeeper 是一个开源的分布式协调服务,它

    2024年02月03日
    浏览(35)
  • 分布式调用与高并发处理 Zookeeper分布式协调服务

    单机架构 一个系统业务量很小的时候所有的代码都放在一个项目中就好了,然后这个项目部署在一台服务器上,整个项目所有的服务都由这台服务器提供。 缺点: 服务性能存在瓶颈,用户增长的时候性能下降等。 不可伸缩性 代码量庞大,系统臃肿,牵一发动全身 单点故障

    2024年02月12日
    浏览(57)
  • 【分布式】Zookeeper

    可以参考:https://zhuanlan.zhihu.com/p/62526102 ZooKeeper 是一个分布式的,开放源码的分布式应用程序协同服务。ZooKeeper 的设计目标是将那些复杂且容易出错的分布式一致性服务封装起来,构成一个高效可靠的原语集,并以一系列简单易用的接口提供给用户使用。 配置管理。 Java微服

    2024年02月11日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包