【Docker】Docker安装Hadoop分布式集群

这篇具有很好参考价值的文章主要介绍了【Docker】Docker安装Hadoop分布式集群。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

Docker安装分布式Hadoop集群

一、准备环境

1. 查看docker的hadoop镜像

docker search hadoop

使用docker搭建hadoop完全分布式集群,hadoop,docker,分布式

2. 拉取stars最多的镜像

docker pull sequenceiq/hadoop-docker

3. 拉取完成后查看镜像是否已到本地

docker images
使用docker搭建hadoop完全分布式集群,hadoop,docker,分布式

4. 运行第一个容器hadoop102

docker run --name hadoop102 -d -h hadoop102 -p 9870:9870 -p 19888:19888 -v /Users/anjuke/opt/data/hadoop:/opt/data/hadoop sequenceiq/hadoop-docker

5. 进入该容器

docker exec -it hadoop102 bash

6. 配置ssh生成秘钥，所有的节点都要配置

/etc/init.d/sshd start

7. 生成密钥

ssh-keygen -t rsa
使用docker搭建hadoop完全分布式集群,hadoop,docker,分布式

8. 复制公钥到authorized_keys中

cd /root/.ssh/
cat id_rsa.pub > authorized_keys

9. 运行hadoop103容器

docker run --name hadoop103 -d -h hadoop103 -p 8088:8088 sequenceiq/hadoop-docker

10. 运行hadoop104容器

docker run --name hadoop104 -d -h hadoop104 sequenceiq/hadoop-docker

11. 分别进入hadoop103、hadoop104容器执行ssh私钥配置，步骤5-8

12. 将三个密钥全部复制到authorized_keys文件

使用docker搭建hadoop完全分布式集群,hadoop,docker,分布式

13. 配置地址映射

vi /etc/hosts
172.17.0.2    hadoop102
172.17.0.3    hadoop103
172.17.0.4    hadoop104

14. 检查ssh是否成功

ssh hadoop102
ssh hadoop103
ssh hadoop104

二、配置Hadoop

hadoop目录安装在：/usr/local/hadoop-2.7.0/etc/hadoop

1. core-site.xml

<configuration>
   <property> 
      <name>fs.defaultFS</name> 
      <value>hdfs://hadoop102:8020</value> 
   </property> 
    <property>
    <name>hadoop.tmp.dir</name>
    <value>/opt/data/hadoop</value>
    </property>
   <property> 
      <name>hadoop.http.staticuser.user</name> 
      <value>root</value> 
   </property>
</configuration>

使用docker搭建hadoop完全分布式集群,hadoop,docker,分布式

2. hdfs-site.xml

<property> 
        <name>dfs.namenode.http-address</name> 
        <value>hadoop102:9870</value> 
    </property>

3. yarn-site.xml

<property> 
        <name>yarn.resourcemanager.hostname</name> 
        <value>hadoop103</value> 
    </property>

4. mapred-site.xml

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

5. 分发文件

scp /usr/local/hadoop-2.7.0/etc/hadoop/core-site.xml hadoop103:/usr/local/hadoop-2.7.0/etc/hadoop
scp /usr/local/hadoop-2.7.0/etc/hadoop/hdfs-site.xml hadoop103:/usr/local/hadoop-2.7.0/etc/hadoop
scp /usr/local/hadoop-2.7.0/etc/hadoop/yarn-site.xml hadoop103:/usr/local/hadoop-2.7.0/etc/hadoop

scp /usr/local/hadoop-2.7.0/etc/hadoop/core-site.xml hadoop104:/usr/local/hadoop-2.7.0/etc/hadoop
scp /usr/local/hadoop-2.7.0/etc/hadoop/hdfs-site.xml hadoop104:/usr/local/hadoop-2.7.0/etc/hadoop
scp /usr/local/hadoop-2.7.0/etc/hadoop/yarn-site.xml hadoop104:/usr/local/hadoop-2.7.0/etc/hadoop

三、启动集群

1. 配置slaves文件

hadoop102
hadoop103
hadoop104

2. 发送到其他节点

scp /usr/local/hadoop-2.7.0/etc/hadoop/slaves hadoop103:/usr/local/hadoop-2.7.0/etc/hadoop
scp /usr/local/hadoop-2.7.0/etc/hadoop/slaves hadoop104:/usr/local/hadoop-2.7.0/etc/hadoop

3. 格式化文件系统

hdfs namenode -format

4. 在hadoop102启动hdfs

sbin/start-dfs.sh

5. 在hadoop103启动yarn

sbin/start-yarn.sh
访问Hadoop102:9870，查看是否能够看到hdfs界面
使用docker搭建hadoop完全分布式集群,hadoop,docker,分布式

访问hadoop103:8088，查看能够看到yarn界面
使用docker搭建hadoop完全分布式集群,hadoop,docker,分布式

集群搭建成功

四案例

1. 执行一些hdfs命令

hadoop fs -ls /
hadoop fs -mkdir /hadoop
hadoop fs -ls /

使用docker搭建hadoop完全分布式集群,hadoop,docker,分布式

2. 上传文件到hdfs上

hadoop fs -put word.txt /hadoop
hadoop fs -ls /hadoop

使用docker搭建hadoop完全分布式集群,hadoop,docker,分布式

3. 执行wordcount案例

./bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.0.jar wordcount /hadoop/word.txt /output

使用docker搭建hadoop完全分布式集群,hadoop,docker,分布式

在yarn上可以看到执行情况

使用docker搭建hadoop完全分布式集群,hadoop,docker,分布式文章来源地址https://www.toymoban.com/news/detail-819785.html

五、关闭集群

hadoop102上：
stop-dfs.sh
hadoop103上：
stop-yarn.sh

到了这里，关于【Docker】Docker安装Hadoop分布式集群的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

【Docker】Docker安装Hadoop分布式集群

Docker安装分布式Hadoop集群

一、准备环境

1. 查看docker的hadoop镜像

2. 拉取stars最多的镜像

3. 拉取完成后查看镜像是否已到本地

4. 运行第一个容器hadoop102

5. 进入该容器

6. 配置ssh生成秘钥，所有的节点都要配置

7. 生成密钥

8. 复制公钥到authorized_keys中

9. 运行hadoop103容器

10. 运行hadoop104容器

11. 分别进入hadoop103、hadoop104容器执行ssh私钥配置，步骤5-8

12. 将三个密钥全部复制到authorized_keys文件

13. 配置地址映射

14. 检查ssh是否成功

二、配置Hadoop

1. core-site.xml

2. hdfs-site.xml

3. yarn-site.xml

4. mapred-site.xml

5. 分发文件

三、启动集群

1. 配置slaves文件

2. 发送到其他节点

3. 格式化文件系统

4. 在hadoop102启动hdfs

5. 在hadoop103启动yarn

四 案例

1. 执行一些hdfs命令

2. 上传文件到hdfs上

3. 执行wordcount案例

五、关闭集群

相关文章

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2

四案例