【hadoop】部署hadoop的伪分布模式

这篇具有很好参考价值的文章主要介绍了【hadoop】部署hadoop的伪分布模式。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

伪分布模式的特点

  1. 在单机上,模拟一个分布式的环境
  2. 具备Hadoop的所有的功能
  3. 用于开发和测试
  •   HDFS:NameNode、DataNode、SecondaryNameNode
    
  •  Yarn:ResourceManager、NodeManager
    

部署伪分布模式

前提:部署好hadoop的本地模式
点击设置hadoop的本地模式

伪分布模式的部署主要是将下面的参数文件的配置参数进行更改。

【hadoop】部署hadoop的伪分布模式,hadoop,hadoop,大数据,分布式

hadoop-env.sh

注:如果在本地模式已经配置完成,这个文件则不需要重复配置。

路径:/root/training/hadoop-2.7.3/etc/hadoop($HADOOP_HOME/etc/hadoop)

更改第25行 export JAVA_HOME=/root/training/jdk1.8.0_181

hdfs-site.xml

进入 /root/training/hadoop-2.7.3/etc/hadoop/ 路径找到 hdfs-site.xml 文件进行编辑。
【hadoop】部署hadoop的伪分布模式,hadoop,hadoop,大数据,分布式

vi hdfs-site.xml

将下面xml代码添加该文件

<!--数据块的冗余度,默认是3-->
<!--一般来说,数据块冗余度跟数据节点的个数一致,最大不超过3-->
<!--由于这是伪分布模式,所以这里冗余度设置为1-->
<property>
		<name>dfs.replication</name>
		<value>1</value>
</property>

【hadoop】部署hadoop的伪分布模式,hadoop,hadoop,大数据,分布式

core-site.xml

需要在hadoop目录下,先创建出tmp文件,作为HDFS对应的操作系统目录。

mkdir /root/training/hadoop-2.7.3/tmp

编辑操作与上面文件相同,则不演示。

<!--配置NameNode的地址-->
<!--9000是RPC通信的端口-->
<property>
		<name>fs.defaultFS</name>
		<value>hdfs://bigdata111:9000</value>
</property>

 <!--HDFS对应的操作系统目录-->
<!--默认值是Linux的tmp目录-->
<property>
		<name>hadoop.tmp.dir</name>
		<value>/root/training/hadoop-2.7.3/tmp</value>
</property>

mapred-site.xml

这个文件默认没有,需要我们先复制

cp mapred-site.xml.template mapred-site.xml

【hadoop】部署hadoop的伪分布模式,hadoop,hadoop,大数据,分布式

<!--配置MapReduce运行的框架是Yarn-->
<property>
		<name>mapreduce.framework.name</name>
		<value>yarn</value>
</property>

yarn-site.xml

<!--配置ResourceManager的地址-->
<property>
		<name>yarn.resourcemanager.hostname</name>
		<value>bigdata111</value>
</property>

<!--MapReduce运行的方式是洗牌-->
<property>
		<name>yarn.nodemanager.aux-services</name>
		<value>mapreduce_shuffle</value>
</property>

对NameNode进行格式化

执行下面这条命名

hdfs namenode -format

成功则出现下面这句话。
【hadoop】部署hadoop的伪分布模式,hadoop,hadoop,大数据,分布式

启动Hadoop

 start-all.sh

【hadoop】部署hadoop的伪分布模式,hadoop,hadoop,大数据,分布式

需要输入4次密码和yes。

至此部署完成,下面进行测试!

对部署是否完成进行测试

将本地文件上传到hdfs
【hadoop】部署hadoop的伪分布模式,hadoop,hadoop,大数据,分布式
进入/root/training/hadoop-2.7.3/share/hadoop/mapreduce/

hadoop jar hadoop-mapreduce-examples-2.7.3.jar wordcount /input /output/wc

【hadoop】部署hadoop的伪分布模式,hadoop,hadoop,大数据,分布式

停止集群

stop-all.sh

【hadoop】部署hadoop的伪分布模式,hadoop,hadoop,大数据,分布式

也需要输入4次密码,输入密码太麻烦,所以我们还需要配置免密码模式

免密码模式

免密码模式的原理(重要)

【hadoop】部署hadoop的伪分布模式,hadoop,hadoop,大数据,分布式

免密码模式的配置

ssh-keygen -t rsa

【hadoop】部署hadoop的伪分布模式,hadoop,hadoop,大数据,分布式

ssh-copy-id -i .ssh/id_rsa.pub root@bigdata111

注:root@bigdata111 是你当前的主机名

【hadoop】部署hadoop的伪分布模式,hadoop,hadoop,大数据,分布式
【hadoop】部署hadoop的伪分布模式,hadoop,hadoop,大数据,分布式

免密码模式配置完成!文章来源地址https://www.toymoban.com/news/detail-583867.html

到了这里,关于【hadoop】部署hadoop的伪分布模式的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • 【hadoop】部署hadoop的伪分布模式

    【hadoop】部署hadoop的伪分布模式

    在单机上,模拟一个分布式的环境 具备Hadoop的所有的功能 用于开发和测试 前提:部署好hadoop的本地模式 点击设置hadoop的本地模式 伪分布模式的部署主要是将下面的参数文件的配置参数进行更改。 注:如果在本地模式已经配置完成,这个文件则不需要重复配置。 路径:/r

    2024年02月17日
    浏览(4)
  • Hadoop集群部署(完全分布式模式、hadoop2.7.3+安装包)

    Hadoop集群部署(完全分布式模式、hadoop2.7.3+安装包)

    目录 一、上传、解压配置 (一)上传 (二)解压 (三)配置hadoop系统环境变量 1.配置hadoop环境变量 2.让环境变量生效 3.验证hadoop系统环境变量 二、修改配置文件  (一)前置介绍 (二)更改配置文件 1.配置Hadoop集群主机点 2.修改core-site.xml文件 3.修改hdfs-site.xml文件 4.修改

    2024年04月25日
    浏览(13)
  • 部署HDFS集群(完全分布式模式、hadoop用户控制集群、hadoop-3.3.4+安装包)

    部署HDFS集群(完全分布式模式、hadoop用户控制集群、hadoop-3.3.4+安装包)

    目录 前置 一、上传解压 (一 )上传 (二)解压 二、修改配置文件 (一)配置workers文件 (二)配置hadoop-env.sh文件 (三)配置core-site.xml文件 (四)配置hdfs-site.xml文件 三、分发到hp2、hp3, 并设置环境变量 (一)准备数据目录    (二)配置环境变量 四、创建数据目录,并

    2024年04月14日
    浏览(14)
  • 基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录)

    基于Windows系统的Hadoop伪分布式模式部署-从零开始(我的学习记录)

    目录 前言 一.JDK的下载安装配置 1.JDK 下载 2.JDK 安装 3.JDK 环境变量配置 4.验证JDK安装是否成功 5.重点? 二.Hadoop部署以及工具集winutils 1.下载Hadoop解压/下载winutils以及\\\"安装\\\"         下载Hadoop和winutils         \\\"安装\\\"winutils 2.配置Hadoop环境变量/配置Hadoop文件 Hadoop配置环境变量

    2024年04月13日
    浏览(11)
  • 大数据学习02-Hadoop分布式集群部署

    大数据学习02-Hadoop分布式集群部署

    操作系统:centos7 软件环境:jdk8、hadoop-2.8.5 1.下载VMware,建议支持正版 2.安装到Widows目录下任意位置即可,安装目录自定义。打开VMware,界面如下: 3.创建虚拟机 创建虚拟机—选择自定义 这一步按照默认的配置就好 选择系统,安装程序光盘映像文件iso,这里需要下载cenos镜像

    2024年02月16日
    浏览(10)
  • Hadoop 完全分布式部署

    Hadoop 完全分布式部署

    前期准备 分析: 准备3台客户机(关闭防火墙、静态IP、主机名称) 【CentOS 7】 安装JDK 【jdk1.8】 安装Hadoop 【hadoop 3.3.4】 配置环境变量 配置ssh 配置集群 单点启动 群起并测试集群 Hadoop 集群规划: node1 node2 node3 IP 10.90.100.121 10.90.100.122 10.90.100.123 HDFS NameNode 、 DataNode DataNode D

    2024年03月23日
    浏览(16)
  • Hadoop分布式安装部署

    Hadoop分布式安装部署

    VMware Workstation Pro17 CentOS7 Hadoop-3.3.6 jdk1.8.0_391 事先需要在本地电脑安装VMware,再创建虚拟机,并且克隆该虚拟机,使用多台机器配合完成完全的分布式文件系统。本文使用三台虚拟机搭建Hadoop。 Hadoop在安装部署之前,需要对虚拟机进行网络配置,将虚拟机的网络状态由动态修

    2024年01月23日
    浏览(16)
  • hadoop伪分布式安装部署

    hadoop伪分布式安装部署

    首先jdk安装完毕 jdk安装文档参考: Linux 环境下安装JDK1.8并配置环境变量_linux安装jdk1.8并配置环境变量_Xi-Yuan的博客-CSDN博客 准备好hadoop的安装包 我的下载地址如下: We Transfer Gratuit. Envoi sécurisé de gros fichiers. 将hadoop包上传到随便一个目录,但是解压缩到/opt/ 目录下 tar -zvxf

    2024年02月08日
    浏览(12)
  • 【Hadoop】安装部署-完全分布式搭建

    【Hadoop】安装部署-完全分布式搭建

    Hadoop是一个适合大数据的分布式存储和计算平台。狭义上说Hadoop就是一个框架平台,广义上讲Hadoop代表大数据的一个技术生态圈,包括很多软件框架。而我们的完全分布式,指的是在真实环境下,使⽤多台机器,共同配合,来构建⼀个完整的分布式文件系统。在真实环境中,

    2024年02月07日
    浏览(13)
  • 【云计算平台】Hadoop全分布式模式环境搭建

    【云计算平台】Hadoop全分布式模式环境搭建

    此前搭建了hadoop的单机模式与伪分布式模式: 单机模式部署 伪分布式模式部署 中间拖得有点久了,今天索性做个了结,把hadoop的全分布式模式部署的操作也简单地记录一下,算是一个系统性的学习吧。 伪分布式模式是学习阶段最常用的模式,它可以将进程都运行在同一台机

    2023年04月08日
    浏览(30)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包