hadoop（伪分布式）上的spark和Scala安装与配置详细版

这篇具有很好参考价值的文章主要介绍了hadoop（伪分布式）上的spark和Scala安装与配置详细版。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

前言：

在搭建spark和Scala前提下，必需安装好hive和java，和 Hadoop的伪分布式哦

一、下载spark和Scala

1、安装与配置Scale

（1）去官网下载Scala

官网地址：The Scala Programming Language (scala-lang.org)https://www.scala-lang.org/ spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

这里我要的是scala-2.2.12.12.tgz

然后我们点击 all releases

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

点进去之后往下找

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

然后找我们需要的tgz文件（注意：在Linux版本中我们需要用到 .tgz后缀）

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

（2）、安装Scala

这里我使用是xshell进行的操作，需要的可以自行下载，这里就不多做解释了（xshell）

打开xshell，连接虚拟机，找到xftp进行文件传输

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

然后进行文件的托拽到（/opt/software）目录下，也可以复制哦

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

这里是拖拽完后的出效果

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

然后我们用xshell进入到此目录下

代码为：

cd /opt/software/

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

进去之后可以看到我们的安装包

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

然后用tar命令解压文件，解压到/opt/module目录下

代码为：

tar -zxvf /opt/software/scala-2.12.12.tgz -C /opt/module/

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

之后就进入/opt/module目录

cd /opt/module/

进行改名字

mv scala-2.12.12/ scala

查看，可以看到scala

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

(3)、配置scala的环境变量

vim进入 /etc/profile目录

vim /etc/profile

键盘输入“a”，进行插入

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

插入俩行配置文件

export SCALA_HOME=/opt/module/scala
export PATH=$PATH:${SCALA_HOME}/bin

这要注意路径问题，如果自己的路径与我不一样就需要改成你放Scala的目录下，还有空格的书写

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

然后退出保存,输入 :wq!

:wq!

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

然后用source重启环境文件

source /etc/profile

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

（4）、Scala的查看

用version查看

scala -version

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

输入scala后，看出现一下就说明搭建成功

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

二、spark部署与安装

（1）spark的下载

去官网下载sparkIndex of /sparkhttps://dlcdn.apache.org/spark/点到里面去

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

选择我们需要的版本

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

下载好后我们使用同样的办法把他放入到 /opt/software 目录下

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

我们进入到/opt/software 目录下查看

cd /opt/software/
ll

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

解压文件到 opt/module/ 目录下

代码

tar -zxvf spark-3.4.2-bin-hadoop3.2.tgz -C /opt/module/

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

把文件名改为spark

mv spark-3.1.1-bin-hadoop3.2 spark

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

（2）、配置spark的环境变量

用vim修改/etc/profile文件

vim /etc/profile

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

输入环境变量

代码

export SPARK_HOME=/opt/module/spark
export PATH=$PATH:${SPARK_HOME}/bin
export PATH=$PATH:${SPARK_HOME}/sbin

输入完后保存并退出

:wq!

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

保存好后就（重启）source一下配置文件

代码

source /etc/profile

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

（3）、修改配置文件

先备份文件cp spark-env.sh.template文件

进入到/conf目录下

cd /opt/module/spark/conf/

备份

cp spark-env.sh.template spark-env.sh

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

进行配置spark配置文件

修改spark- env.sh文件，加以下内容:

vim spark-env.sh

内容：

export SCALA_HOME=/opt/module/scala
export JAVA_HOME=/opt/module/java
export SPARK_MASTER_IP=master
export SPARK_WOKER_CORES=2
export SPARK_WOKER_MEMORY=2g
export HADOOP_CONF_DIR=/usr/opt/module/hadoop/etc/hadoop
#export SPARK_MASTER_WEBUI_PORT=8080
#export SPARK_MASTER_PORT=7070

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

（4）进入spark/sbin 启动spark ./start-all.sh

cd /opt/module/spark/sbin
./start-all.sh

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

(5)查看spark

spark-submit --version

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

出现上面的情况，说明你的伪分布式的spark安装成功！！！文章来源地址https://www.toymoban.com/news/detail-861431.html

到了这里，关于hadoop（伪分布式）上的spark和Scala安装与配置详细版的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

Toy模板网

hadoop（伪分布式）上的spark和Scala安装与配置详细版

前言：

一、下载spark和Scala

1、安装与配置Scale

二、spark部署与安装

（1）spark的下载

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2