Windows10系统spark3.0.0配置

这篇具有很好参考价值的文章主要介绍了Windows10系统spark3.0.0配置。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

前言

Windows10系统基本环境：spark3.0.0+hadoop3.1.0+scala2.12.0+java jdk1.8。

一、配置java jdk1.8

1. jdk环境变量配置

环境变量配置路径：电脑→属性→高级系统设置→环境变量

windows下安装spark并配置scala,spark

path中加入：%JAVA_HOME%/bin。
注：jdk版本不宜过高。

2. 配置验证

cmd验证：

java -version

windows下安装spark并配置scala,spark

二、配置scala2.12.0

1.下载scala安装包

官方下载网址：https://www.scala-lang.org/

windows下安装spark并配置scala,spark

选择对应版本，这里我选择的是scala2.12.0版本。

windows下安装spark并配置scala,spark

下载Windows系统对应的压缩包。

windows下安装spark并配置scala,spark

2. 配置scala环境

环境变量配置路径：此电脑→属性→高级系统设置→环境变量

windows下安装spark并配置scala,spark

path中加入：%SCALA_HOME%/bin。

3. 验证配置

cmd验证配置：

scala -version

windows下安装spark并配置scala,spark

三、配置Hadoop3.1.0

1.Hadoop下载

从Apache官网下载Hadoop：https://hadoop.apache.org/
官网下载速度较慢，也可使用国内镜像下载。

2. Hadoop环境变量配置

配置步骤同Scala配置。

注意：需要把%HADOOP_HOME%\bin与%HADOOP_HOME%\sbin一同加入path中。

3. Windows系统bin下载：

windows系统需要替换hadoop安装包里的bin文件夹。

windows下安装spark并配置scala,spark

不同版本bin文件下载链接：https://gitee.com/tlbrun/hadoopWinutils/。
下载成功直接覆盖本地bin。

4. 配置Hadoop启动文档和脚本

配置\etc\hadoop\下的如下5个文件。

windows下安装spark并配置scala,spark

（1）在core-site.xml末尾加入如下代码，代码中路径按照自己本地路径相应修改：

<name>fs.default.name</name>

<value>hdfs://localhost:8900</value>

</property>

<name>hadoop.tmp.dir</name>

<value>E:/soft/hadoop-3.1.0/tmp/${user.name}</value>

<description>A base for other temporary directories.</description>

</property>

</configuration>

（2）在hdfs-site.xml末尾加入如下代码，代码中路径按照自己本地路径相应修改：

<name>dfs.replication</name>

</property>

<name>dfs.permissions</name>

<value>false</value>

</property>

<name>dfs.namenode.name.dir</name>

<value>/E:/soft/hadoop-3.1.0/data/namenode</value>

</property>

<name>fs.checkpoint.dir</name>

<value>/E:/soft/hadoop-3.1.0/data/snn</value>

</property>

<name>fs.checkpoint.edits.dir</name>

<value>/E:/soft/hadoop-3.1.0/data/snn</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>/E:/soft/hadoop-3.1.0/data/datanode</value>

</property>

</configuration>

（3）在yarn-site.xml末尾添加如下代码：

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

</configuration>

（4）在mapred-site.xml末尾添加如下代码：

<name>mapreduce.framework.name</name>

</property>

</configuration>

（5）在hadoop-env.cmd配置以下2个地方：

windows下安装spark并配置scala,spark

5. 启动Hadoop

进入hadoop目录：E:\soft\hadoop-3.1.0\bin，打开cmd，执行命令：

.\hdfs namenode -format

进入目录：E:\soft\hadoop-3.1.0\sbin，找到start-all.cmd，右键以管理员身份运行。
运行完毕可以看到以下四个服务：

windows下安装spark并配置scala,spark

四、配置Spark3.0.3

1. Spark下载

Spark3.0.3官网下载：

https://spark.apache.org/releases/spark-release-3-0-0.html

2. Spark环境配置

配置步骤同scala配置。

注意：需要把%SPARK_HOME%\bin与%SPARK_HOME%\sbin一同加入path中。

3. 配置验证

cmd命令：

spark-shell

windows下安装spark并配置scala,spark

Spark配置成功。文章来源地址https://www.toymoban.com/news/detail-858212.html

到了这里，关于Windows10系统spark3.0.0配置的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

Toy模板网

Windows10系统spark3.0.0配置

前言

一、配置java jdk1.8

1. jdk环境变量配置

2. 配置验证

二、配置scala2.12.0

1.下载scala安装包

2. 配置scala环境

3. 验证配置

三、配置Hadoop3.1.0

1.Hadoop下载

2. Hadoop环境变量配置

3. Windows系统bin下载：

4. 配置Hadoop启动文档和脚本

5. 启动Hadoop

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2