2-1.Hadoop大数据集群搭建之---本地模式

这篇具有很好参考价值的文章主要介绍了2-1.Hadoop大数据集群搭建之---本地模式。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

Hadoop运行模式主要包括三种：本地模式、伪分布式模式以及完全分布式模式。

1. 本地模式（Local/Standalone Mode）：在这种模式下，Hadoop作为一个独立的系统运行，不依赖于外部资源或网络连接。它可以在单个服务器上运行，数据通常存储在本地的HDFS（Hadoop Distributed FileSystem）上。这种模式适合用于学习和开发阶段的调试，因为它不需要额外的配置和管理。

2. 伪分布式模式（Pseudo-Distributed Mode）：在这种模式下，Hadoop仍然是一个独立的系统，但它通过模拟分布式环境的各个组件来运行。这意味着数据会被存储在HDFS上，但是所有的工作流程都在单台服务器上完成，即没有真正的分布式处理能力。伪分布式模式常用于小型的测试环境。

3. 完全分布式模式（Fully-Distributed Mode）：这是Hadoop最常用的模式，它涉及到多台服务器组成的集群，每个服务器负责特定的任务。在这种模式下，数据被分散存储在HDFS上，而且不同节点的任务之间可以进行通信。完全分布式模式适用于大规模数据处理和高并发请求的场景。

本地模式单机运行，只是用来简单演示一下官方案例，生产环境不用。伪分布模式也是单机运行，但是具备Hadoop集群的所有功能，一台服务器模拟一个分布式的环境。

本篇文章我们给大家介绍一下本地模式如何使用。我们来演示一下官方的WordCount例子。

1. 安装Hadoop

（1）下载Hadoop安装包

第一种方法是从Hadoop的官网去下载，可能网速比较慢。
第二种方法从国内的镜像源进行下载。我一般从清华大学镜像源去下载。（Hadoop清华大学镜像源内下载地址）
2-1.Hadoop大数据集群搭建之---本地模式,大数据集群搭建,hadoop
选择3.3.5版本进行下载。

（2）上传Hadoop安装包并解压

下载后通过mobaXterm上传至bigdata01节点上的/opt/software路径下。然后通过下面命令进行解压到/opt/module路径下，并进行重命名为hadoop_local。

tar -zxvf hadoop-3.3.5.tar.gz -C /opt/module/
cd /opt/module
cp -r hadoop-3.3.5/ hadoop-local

2-1.Hadoop大数据集群搭建之---本地模式,大数据集群搭建,hadoop

因为我们分别演示三种不同模式，所以，我们将hadoop的解压包分别复制成三种不同的文件夹。

（3）将hadoop添加到环境变量（bigdata_env.sh）

sudo vim /etc/profile.d/bigdata_env.sh

在bigdata_env.sh中添加下面的内容。

#HADOOP
export HADOOP_HOME=/opt/module/hadoop_local
export PATH=$PATH:$HADOOP_HOME/bin

然后使环境变量生效。

source /etc/profile

2-1.Hadoop大数据集群搭建之---本地模式,大数据集群搭建,hadoop

（4）测试是否安装成功

hadoop version

2-1.Hadoop大数据集群搭建之---本地模式,大数据集群搭建,hadoop

2.本地运行模式

（1）在hadoop_local路径下创建一个wcinput文件夹

[bduser@bigdata01 hadoop_local]$ mkdir wcinput

（2）在wcinput文件夹下创建一个word.txt文件

[bduser@bigdata01 hadoop_local]$ cd wcinput
[bduser@bigdata01 wcinput]$ touch word.txt

（3）编辑word.txt文件

[bduser@bigdata01 wcinput]$ vim word.txt

在word文件中输入以下内容：

hadoop yarn
hadoop mapreduce
hello world
hello java
hello spark

（4）返回到目录/opt/module/hadoop_local

（5）执行程序

[bduser@bigdata01 hadoop_local]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.5.jar 
 wordcount wcinput wcoutput

（6）查看结果

[bduser@bigdata01 hadoop_local]$ cat wcoutput/part-r-00000

2-1.Hadoop大数据集群搭建之---本地模式,大数据集群搭建,hadoop 文章来源地址https://www.toymoban.com/news/detail-826087.html

至此Hadoop的本地模式演示完成。

到了这里，关于2-1.Hadoop大数据集群搭建之---本地模式的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

Toy模板网

2-1.Hadoop大数据集群搭建之---本地模式

本篇文章我们给大家介绍一下本地模式如何使用。我们来演示一下官方的WordCount例子。

1. 安装Hadoop

（1）下载Hadoop安装包

（2）上传Hadoop安装包并解压

（3）将hadoop添加到环境变量（bigdata_env.sh）

（4）测试是否安装成功

2.本地运行模式

（1）在hadoop_local路径下创建一个wcinput文件夹

（2）在wcinput文件夹下创建一个word.txt文件

（3）编辑word.txt文件

（4）返回到目录/opt/module/hadoop_local

（5）执行程序

（6）查看结果

至此Hadoop的本地模式演示完成。

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2