hadoop(伪分布式)上的spark和Scala安装与配置详细版

这篇具有很好参考价值的文章主要介绍了hadoop(伪分布式)上的spark和Scala安装与配置详细版。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言:

在搭建spark和Scala前提下,必需安装好hive和java,和 Hadoop的伪分布式 哦

一、下载spark和Scala

1、安装与配置Scale     

  (1)去官网下载Scala

        官网地址:The Scala Programming Language (scala-lang.org)https://www.scala-lang.org/spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

这里我要的是scala-2.2.12.12.tgz

然后我们点击 all releases

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

点进去之后往下找

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

然后找我们需要的tgz文件(注意:在Linux版本中我们需要用到 .tgz后缀

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

(2)、安装Scala

这里我使用是xshell进行的操作,需要的可以自行下载,这里就不多做解释了(xshell)

打开xshell,连接虚拟机,找到xftp进行文件传输

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

然后进行文件的托拽到(/opt/software)目录下,也可以复制哦

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

这里是拖拽完后的出效果

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

然后我们用xshell进入到此目录下

代码为:

cd /opt/software/

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

进去之后可以看到我们的安装包

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

然后用tar命令解压文件,解压到/opt/module目录下

代码为:

tar -zxvf /opt/software/scala-2.12.12.tgz -C /opt/module/

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

之后就进入/opt/module目录

cd /opt/module/

进行改名字

mv scala-2.12.12/ scala

查看,可以看到scala

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

(3)、配置scala的环境变量

        vim进入 /etc/profile目录

vim /etc/profile

键盘输入“a”,进行插入

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

插入俩行配置文件

export SCALA_HOME=/opt/module/scala
export PATH=$PATH:${SCALA_HOME}/bin

这要注意路径问题,如果自己的路径与我不一样就需要改成你放Scala的目录下,还有空格的书写

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

然后退出保存,输入 :wq!

:wq!

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

然后用source重启环境文件

source /etc/profile

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

(4)、Scala的查看

用version查看

scala -version

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

输入scala后,看出现一下就说明搭建成功

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

二、spark部署与安装

(1)spark的下载

        去官网下载sparkIndex of /sparkhttps://dlcdn.apache.org/spark/点到里面去

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

选择我们需要的版本

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

下载好后我们使用同样的办法把他放入到 /opt/software 目录下

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

我们进入到/opt/software 目录下查看

cd /opt/software/
ll

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

解压文件到 opt/module/ 目录下

代码

tar -zxvf spark-3.4.2-bin-hadoop3.2.tgz -C /opt/module/

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

把文件名改为spark

mv spark-3.1.1-bin-hadoop3.2 spark

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

(2)、配置spark的环境变量

用vim修改/etc/profile文件

vim /etc/profile

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

输入环境变量

代码

export SPARK_HOME=/opt/module/spark
export PATH=$PATH:${SPARK_HOME}/bin
export PATH=$PATH:${SPARK_HOME}/sbin

输入完后保存并退出

:wq!

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

保存好后就(重启)source一下配置文件

代码

source /etc/profile

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

(3)、修改配置文件

     先备份文件cp spark-env.sh.template文件

进入到/conf目录下

cd /opt/module/spark/conf/

备份

cp spark-env.sh.template spark-env.sh

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

进行配置spark配置文件

修改spark- env.sh文件,加以下内容:

vim spark-env.sh

内容:

export SCALA_HOME=/opt/module/scala
export JAVA_HOME=/opt/module/java
export SPARK_MASTER_IP=master
export SPARK_WOKER_CORES=2
export SPARK_WOKER_MEMORY=2g
export HADOOP_CONF_DIR=/usr/opt/module/hadoop/etc/hadoop
#export SPARK_MASTER_WEBUI_PORT=8080
#export SPARK_MASTER_PORT=7070

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

(4)进入spark/sbin 启动spark ./start-all.sh

cd /opt/module/spark/sbin
./start-all.sh 

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

(5)查看spark

spark-submit --version

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

spark搭建伪分布式平台包含hadoop scala,分布式,hadoop,spark

出现上面的情况,说明你的伪分布式的spark安装成功!!!文章来源地址https://www.toymoban.com/news/detail-861431.html

到了这里,关于hadoop(伪分布式)上的spark和Scala安装与配置详细版的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【云平台技术】Hadoop全分布式安装与配置

    目录 一、虚拟机安装  1、创建虚拟机 2、虚拟机启动初始化 二、 虚拟机克隆 三、Linux系统的网络配置 1、准备工作 2、 主机名和IP映射 2.1 配置主机名 2.2 配置IP映射   3、网络参数配置 四、SSH服务配置  1、生成密钥文件 2、将本机公钥文件复制到其他虚拟机上  五、JDK安装

    2024年02月08日
    浏览(38)
  • Hadoop(01) Hadoop3.3.6安装教程,单机/伪分布式配置

    在安装 Hadoop 3.3.6 前,需要满足以下前置条件: Java Development Kit (JDK):Hadoop 是用 Java 编写的,因此需要安装并配置适当版本的 JDK。Hadoop 3.3.6 建议使用 JDK 8 或更高版本。确保正确安装 JDK,并设置 JAVA_HOME 环境变量。 SSH:Hadoop 集群中的节点需要通过 SSH 进行通信和管理。确保在

    2024年02月06日
    浏览(49)
  • 分布式搭建(hadoop+hive+spark)

    hadoop-master 192.168.43.141 hadoop-slave1 192.168.43.142 hadoop-slave2 192.168.43.143 链接:https://pan.baidu.com/s/1OwKLvZAaw8AtVaO_c6mvtw?pwd=1234 提取码:1234 MYSQL5.6:wget http://repo.mysql.com/mysql-community-release-el6-5.noarch.rpm Scale:wget https://downloads.lightbend.com/scala/2.12.4/scala-2.12.4.tgz

    2024年02月12日
    浏览(43)
  • Hadoop3.1.3安装教程单机伪分布式配置

    本教程使用 Ubuntu 18.04 64位 作为系统环境(或者Ubuntu 14.04,Ubuntu16.04 也行,32位、64位均可),请自行安装系统。装好了 Ubuntu 系统之后,在安装 Hadoop 前还需要做一些必备工作。 创建hadoop用户 如果你安装 Ubuntu 的时候不是用的 “hadoop” 用户,那么需要增加一个名为 hadoop 的用

    2024年02月04日
    浏览(51)
  • 《Hadoop大数据技术》实验报告(1)Hadoop的伪分布式安装和配置

    《Hadoop大数据技术》实验报告(1) 班级 学号 姓名 Hadoop的伪分布式安装和配置 一、实验目的 1、理解Hadoop伪分布式的安装过程; 2、学会JDK的安装和SSH免密码配置; 3、学会Hadoop的伪分布式安装和配置。 二、实验内容 在linux平台中安装Hadoop,包括JDK安装、SSH免密码配置和伪分

    2023年04月23日
    浏览(66)
  • Hadoop(伪分布式)+Spark(local模式)搭建Hadoop和Spark组合环境

    环境 使用 Ubuntu 14.04 64位 作为系统环境(Ubuntu 12.04,Ubuntu16.04 也行,32位、64位均可),请自行安装系统。 Hadoop版本 : Hadoop 2.7.4 创建hadoop用户 如果你安装 Ubuntu 的时候不是用的 \\\"hadoop\\\" 用户,那么需要增加一个名为 hadoop 的用户。 首先按 ctrl+alt+t 打开终端窗口,输入如下命令创

    2023年04月08日
    浏览(70)
  • Hadoop3.3.5云耀云服务器安装教程-单机/伪分布式配置

    华为云耀云服务器试用领取 领取的试用云耀云服务器在哪 阿里云服务器免费试用领取 Hadoop3.3.5云耀云服务器安装教程-单机/伪分布式配置 阿里云服务器ECS安装图形界面 本篇文章是基于上一篇所配置好的云服务器进行实验软件安装,该系列文章是根据林子雨所讲述的课程就在

    2024年01月21日
    浏览(54)
  • 大数据-安装 Hadoop3.1.3 详细教程-伪分布式配置(Centos7)

    **相关资源:**https://musetransfer.com/s/q43oznf6f(有效期至2023年3月16日)|【Muse】你有一份文件待查收,请点击链接获取文件 1.检查是否安装ssh (CentOS 7 即使是最小化安装也已附带openssh 可跳过本步骤) 若已安装进行下一步骤 若未安装 请自行百度 本教程不做过多讲解 2.配置ss

    2023年04月08日
    浏览(43)
  • 【大数据】Hadoop-3.3.4完全分布式安装(包含VMware16和Ubuntu22的下载安装及配置)、搭建、配置教程,以及Hadoop基础简介

    注:本篇文章主要涉及到: HDFS (分布式文件系统)、 YARN (资源管理和调度框架)、以及 MapReduce (离线计算)。 以下就是本篇文章所采用的的架构 。 (1)HDFS架构简述 HDFS架构图 注:上述的master、slave1、slave2均是主机名(结点名),可以和本篇文章不一致,但下面所有涉

    2023年04月17日
    浏览(99)
  • 头歌Hadoop 开发环境搭建及HDFS初体验(第2关:配置开发环境 - Hadoop安装与伪分布式集群搭建)

    注: 1 头歌《Hadoop 开发环境搭建及HDFS初体验》三关在一个实验环境下,需要三关从前往后按顺序评测,跳关或者实验环境结束后重新打开 不能单独评测通过 2 复制粘贴请用右键粘贴,CTRL+C/V不管用哦~ 第1关:配置开发环境 - JavaJDK的配置: 解压: 配置环境变量: 细节: vi

    2024年02月08日
    浏览(213)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包