夜已深,注意休息哦!

大数据

Zookeeper入门教程(一):Zookeeper简介与安装教程

2021年03月25日 10:45:51 · 本文共 2,003 字阅读时间约 7分钟 · 2,813 次浏览
Zookeeper入门教程(一):Zookeeper简介与安装教程

什么是Zookeeper

ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。

它可以接受观察者的注册订阅,当数据发生改变时就可以通知观察者,你可以理解为 ZooKeeper = 文件系统+通知机制。

ZooKeeper 是由一个领导者(Leader)和多个跟随者(Follower)注册的集群,只要有半数以上的节点存活,就可以正常提供服务,同时还可以保证全局数据一致性、请求顺序执行、更新原子性等特点。

它的数据结构和 Unix 系统很像,由根开始,下面有子节点,像文件夹一样一级一级的排列下去,每个Node节点默认能存储 1MB 的数据。

Zookeeper官网:https://zookeeper.apache.org

Zookeeper本地安装教程

必要条件

在开始之前,需要先安装 Java 运行环境 JDK,此处不在赘述,默认大家已经配置好了 JDK,这个是基础内容,如果不会的同学请先搜索安装 JDK 的教程。下载Zookeeper并解压到本地文件夹。

修改配置

我在我自己电脑上已经下载Zookeeper并解压到了/Users/renfei/apache-zookeeper-3.6.2-bin,配置文件就在 apache-zookeeper-3.6.2-bin/conf 里面,复制 zoo_sample.cfg 文件为 zoo.cfg,这个 zoo.cfg 就是我们要修改的配置文件了。

主要修改数据目录地址:dataDir=/Users/renfei/apache-zookeeper-3.6.2-bin/zkData,这个改成你自己的本地路径。

其他配置说明

  • tickTime =2000:通信心跳数,Zookeeper服务器与客户端心跳时间,单位毫秒。服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个tickTime时间就会发送一个心跳,并且设置最小的session超时时间为两倍心跳时间。

  • initLimit =10:LF初始通信时限。集群中的Follower跟随者服务器与Leader领导者服务器之间初始连接时能容忍的最多心跳数(tickTime的数量),用它来限定集群中的Zookeeper服务器连接到Leader的时限。

  • syncLimit =5:LF同步通信时限。集群中Leader与Follower之间的最大响应时间单位,假如响应超过syncLimit * tickTime,Leader认为Follwer死掉,从服务器列表中删除Follwer。

  • clientPort =2181:客户端连接端口

启动Zookeeper

执行:

bin/zkServer.sh start

启动客户端

bin/zkCli.sh

Zookeeper分布式安装教程

必要条件

在前面的系列教程中《Hadoop入门教程(四):Hadoop 完全分布式集群环境》我们已经搭建了集群,我们现在就往集群中安装Zookeeper,所以搭建集群的相关事项就不再赘述了。同样是下载Zookeeper到集群并解压到集群机器的本地文件夹。

修改配置

与本地运行不同的是,这里我们需要先建立好数据文件夹,例如:mkdir /Users/renfei/apache-zookeeper-3.6.2-bin/zkData,然后再创建一个 myid 文件:touch myid,然后在这个文件中写入服务器的编号。

同样复制 apache-zookeeper-3.6.2-bin/conf/zoo_sample.cfg 文件为 zoo.cfg,这个 zoo.cfg 就是我们要修改的配置文件了。

修改数据目录:dataDir=/Users/renfei/apache-zookeeper-3.6.2-bin/zkData,这个改成你自己的本地路径。然后增加如下配置,请根据你的集群环境修改:

server.1=n1.renfei.net:2888:3888
server.2=n2.renfei.net:2888:3888
server.3=n3.renfei.net:2888:3888

格式是:server.A=B:C:D

  • A是一个数字,表示这个是第几号服务器。集群模式下配置一个文件myid,这个文件在dataDir目录下,这个文件里面有一个数据就是A的值,Zookeeper启动时读取此文件,拿到里面的数据与zoo.cfg里面的配置信息比较从而判断到底是哪个server。

  • B是这个服务器的地址;

  • C是这个服务器Follower与集群中的Leader服务器交换信息的端口;

  • D是万一集群中的Leader服务器挂了,需要一个端口来重新进行选举,选出一个新的Leader,而这个端口就是用来执行选举时服务器相互通信的端口。

启动Zookeeper

在集群环境中,我们需要分别启动各个节点的 Zookeeper:bin/zkServer.sh start

客户端命令行

命令基本语法功能描述
help显示所有操作命令
ls path [watch]使用 ls 命令来查看当前znode中所包含的内容
ls2 path [watch]查看当前节点数据并能看到更新次数等数据
create普通创建
-s含有序列
-e临时(重启或者超时消失)
get path [watch]获得节点的值
set设置节点的具体值
stat查看节点状态
delete删除节点
rmr递归删除节点

对于程序员 Linux 操作应该不用多说了吧,按照上面的语法或者官方文档就可以操作了,大多数情况下咱们都是编程操作 ZK,这个就不多说了。


商业用途请联系作者获得授权。
版权声明:本文为博主「任霏」原创文章,遵循 CC BY-NC-SA 4.0 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://www.renfei.net/posts/1003476
评论与留言

以下内容均由网友提交发布,版权与真实性无法查证,请自行辨别。

微信搜一搜:任霏博客