ubuntu中Hadoop伪分布安装

这篇具有很好参考价值的文章主要介绍了ubuntu中Hadoop伪分布安装。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

1. 更新apt和安装VIm编辑器

2. 安装SSH

3. 查看IP

4. 安装Java环境

5. Hadoop伪分布安装


Hadoop伪分布安装。主要参考《大数据技术原理与应用》第三版。

1. 更新apt和安装VIm编辑器

命令如下:

sudo apt-get update

提示输入密码,完成密码输入即可自动更新

可以使用Vim编辑器完成文件创建与修改,安装Vim命令如下:

sudo apt-get install vim

安装过程提示Do you want to continue? [Y/n],输入y,回车即可继续(其他安装遇到相同问题也是如此)

2. 安装SSH

hadoop的NameNode需要启动集群所有机器的hadoop守护进程,主要通过SSH登录实现。为顺利从主节点无密码地登录从节点每台机器,需要安装SSH服务器和客户端。Ubuntu已安装SSH客户端,先只需安装SSH服务端即可,命令如下:

sudo apt-get install openssh-server

安装完成后,可以通过下面命令登录本机

ssh localhost  

出现Are you sure you want to continue connecting (yes/no/[fingerprint])?  

输入  yes  后回车,然后输入密码即可。

退出ssh登录,生成密钥并加入授权。

退出    exit

ubuntu中Hadoop伪分布安装,hadoop,大数据,分布式

进入 ~/.ssh 目录,生成密钥

cd ~/.ssh/        # 若没有该目录,请先执行一次ssh localhost
ssh-keygen -t rsa   # 会有提示,都按回车就可以

输入上面命令后,一直按回车即可生成密钥。

ubuntu中Hadoop伪分布安装,hadoop,大数据,分布式

将id_rsa.pub文件的内容追加到authorized_keys文件中

cat id_rsa.pub >> authorized_keys     # 加入授权

ubuntu中Hadoop伪分布安装,hadoop,大数据,分布式

对于伪分布来说,ssh localhost 命令能够免密钥登录,就ok了。

ubuntu中Hadoop伪分布安装,hadoop,大数据,分布式


3. 查看IP

(1)安装net-tools包

sudo apt install net-tools

(2)通过 ifconfig 查看本机ip信息

ubuntu中Hadoop伪分布安装,hadoop,大数据,分布式

4. 安装Java环境

提前准备好JDK1.8,放到ubuntu中,如果在windows上, 可以直接复制,到ubuntu上粘贴即可。

先在/home/peng目录下创建bigdata文件夹。peng是我的用户名,根据实际的修改即可。

mkdir /home/peng/bigdata

将安装文件放到该目录下。然后将继续创建目录存放解压的JDK文件。

cd /usr/lib
sudo mkdir jvm

将JDK解压到 /usr/lib/jvm 目录去

cd
cd bigdata
sudo tar -zxvf jdk-8u162-linux-x64.tar.gz -C /usr/lib/jvm

设置环境变量

vim  ~/.bashrc

可在开头添加下面几行,注意,进入编辑文本窗口后, 按 字母    i     进入编辑每行开头的# 号代表注释,保持并退出编辑: 先按 ESC, 再按 冒号:,再按 wq  。 退出不保存是 先按ESC,再按 q!

export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_162
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH

保存并退出编辑,下面命令让.bashrc文件生效:

source ~/.bashrc

通过java -version 查看是否安装成功,出现如下说明安装成功。

ubuntu中Hadoop伪分布安装,hadoop,大数据,分布式

5. Hadoop伪分布安装

伪分布安装,仅需要 修改  core-site.xml  和 hdfs-site.xml文件即可.

先进入bigdata文件夹解压hadoop压缩包。

cd  ~/bigdata
tar -zxvf hadoop-3.1.3.tar.gz

ubuntu中Hadoop伪分布安装,hadoop,大数据,分布式

解压完成后,进入  hadoop/etc/hadoop  目录完成上面文件配置。

cd  hadoop-3.1.3/etc/hadoop
vim core-site.xml

core-site.xml配置如下, 注意 补充好<configuration>内容即可:

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/peng/bigdata/hadoopdata/</value> 
        <description>需要先创建该目录</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>
mkdir  /home/peng/bigdata/hadoopdata
vim hdfs-site.xml

hdfs-site.xml配置如下:

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/home/peng/bigdata/hadoopdata/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/home/peng/bigdata/hadoopdata/dfs/data</value>
    </property>
</configuration>

修改坏境变量

vim ~/.bashrc

添加 HADOOP_HOME

export HADOOP_HOME=/home/peng/bigdata/hadoop-3.1.3
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

使改动生效:

source ~/.bashrc

查看Hadoop版本信息

ubuntu中Hadoop伪分布安装,hadoop,大数据,分布式

格式化文件系统

hadoop namenode -format

注:若有需要再次格式化,请将$HADOOP_HOME/logs文件夹里面内容清空。以及hadoopdata文件夹里面的内容清空。

成功后,可以启动集群,启动hdfs和yarn

start-all.sh

ubuntu中Hadoop伪分布安装,hadoop,大数据,分布式

Jps查看进程,NameNode、Datanode、ResourceManager、NodeManager、SecondaryNameNode都齐全证明配置成功。

ubuntu中Hadoop伪分布安装,hadoop,大数据,分布式

网页端查看HDFS文件系统,在浏览器输入:http://localhost:9870/      ,注意,如果用的是hadoop2,端口号是 50070

ubuntu中Hadoop伪分布安装,hadoop,大数据,分布式

网页端查看YARN,在浏览器输入:

ubuntu中Hadoop伪分布安装,hadoop,大数据,分布式

至此,Hadoop伪分布安装已完成。

建议看官网:

Apache Hadoop 3.1.3 – Hadoop: Setting up a Single Node Cluster.文章来源地址https://www.toymoban.com/news/detail-849594.html

到了这里,关于ubuntu中Hadoop伪分布安装的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 大数据 | 实验零:安装 Hadoop 伪分布式系统

    👀 前言 :本篇是个人配置环境的总结,基于指导书,补充了许多在配置过程中出现的问题的解决细节。希望能帮到你😄。 Vmware workstation pro 16 Ubuntu 20.04 JDK 1.8 Hadoop 3.2.2 下边资源是本篇博客会用到的相关文件 (建议直接下载,相关代码直接对应的下述文件, 下载完先不要动

    2023年04月17日
    浏览(49)
  • 在macOS上安装Hadoop: 从零到分布式大数据处理

    要在 macOS 上安装 Hadoop,您可以按照以下步骤进行操作: 前往Hadoop的官方网站下载最新版本的Hadoop。选择一个稳定的发行版本并下载压缩文件(通常是.tar.gz格式)。 将下载的 Hadoop 压缩文件解压缩到您选择的目录中。可以使用终端执行以下命令: 请将 hadoop-version 替换为您下

    2024年02月06日
    浏览(57)
  • 大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

    **相关资源:**https://musetransfer.com/s/q43oznf6f(有效期至2023年3月16日)|【Muse】你有一份文件待查收,请点击链接获取文件 1.检查是否安装ssh (CentOS 7 即使是最小化安装也已附带openssh 可跳过本步骤) 若已安装进行下一步骤 若未安装 请自行百度 本教程不做过多讲解 2.配置ss

    2023年04月08日
    浏览(43)
  • Hadoop分布式安装

    首先准备好三台服务器或者虚拟机,我本机安装了三个虚拟机,安装虚拟机的步骤参考我之前的一篇 virtualBox虚拟机安装多个+主机访问虚拟机+虚拟机访问外网配置-CSDN博客 jdk安装 参考文档:Linux 环境下安装JDK1.8并配置环境变量_linux安装jdk1.8并配置环境变量_Xi-Yuan的博客-CSDN博

    2024年02月08日
    浏览(53)
  • Hadoop分布式集群安装

            上一篇大数据文章讲解了在单机上搭建Hadoop-Yarn 伪分布式集群的安装方法,方便大家学习,真实环境不可能只有一台机器,肯定是多节点的集群,大单位还会建设很多Hadoop集群,比如各个大部门有自己的集群,或者按热、温、冷来划分建立集群,反正都是很多台服

    2024年01月19日
    浏览(51)
  • Hadoop分布式安装部署

    VMware Workstation Pro17 CentOS7 Hadoop-3.3.6 jdk1.8.0_391 事先需要在本地电脑安装VMware,再创建虚拟机,并且克隆该虚拟机,使用多台机器配合完成完全的分布式文件系统。本文使用三台虚拟机搭建Hadoop。 Hadoop在安装部署之前,需要对虚拟机进行网络配置,将虚拟机的网络状态由动态修

    2024年01月23日
    浏览(56)
  • Hadoop伪分布式安装配置

    1、添加用户组 [root@hadoop00 ~]# groupadd hadoop 2、添加用户并分配用户组 [root@hadoop00 ~]# useradd -g hadoop hadoop 3、修改hadoop用户密码 [root@hadoop00 ~]# passwd hadoop 1、上传系统安装镜像到虚拟机服务器的/root目录 2、新建挂载点目录 [root@hadoop00 ~]# mkdir /mnt/centos 3、挂载镜像        [root@h

    2024年01月24日
    浏览(49)
  • hadoop伪分布式安装部署

    首先jdk安装完毕 jdk安装文档参考: Linux 环境下安装JDK1.8并配置环境变量_linux安装jdk1.8并配置环境变量_Xi-Yuan的博客-CSDN博客 准备好hadoop的安装包 我的下载地址如下: We Transfer Gratuit. Envoi sécurisé de gros fichiers. 将hadoop包上传到随便一个目录,但是解压缩到/opt/ 目录下 tar -zvxf

    2024年02月08日
    浏览(46)
  • (小白全过程记录)Ubuntu下伪分布式Hadoop环境搭建

    目录 0.准备 1.Hadoop伪分布式环境搭建 2.安装ssh,配置ssh无密码登录 3.通过拖拽的方式将文件从windows传到linux桌面 5.安装hadoop 6.修改hadoop环境变量 7.修改配置文件 core-site.xml 8.修改配置文件hdfs-site.xml文件 9.执行NameNode的格式化 10.开启NameNode和DataNode守护进程 11.访问web页面 12.关闭

    2024年02月03日
    浏览(49)
  • Hadoop伪分布式安装搭建教程

    安装VMware虚拟机 下载Ubuntu 18.04镜像,并在VMware中新建虚拟机 安装VMware tools 搭建Hadoop伪分布式 1.安装VMware Workstation 14 Pro版本 2.1 在VMware上方菜单栏,文件--新建虚拟机  2.2 默认  2.3 选择稍后安装操作系统 2.4 选择Linux(L),版本 Ubuntu    2.5 定义虚拟机的名称,选择虚拟机的

    2023年04月09日
    浏览(39)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包