Spark Standalone 模式的安装和部署第1关： Standalone 分布式集群搭建

1年前作者：是草莓熊吖分类：Toy博客阅读(7)违法举报

这篇具有很好参考价值的文章主要介绍了Spark Standalone 模式的安装和部署第1关： Standalone 分布式集群搭建。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

我们已经掌握了 Spark 单机版安装，那么分布式集群怎么搭建呢？接下来我们学习 Standalone 分布式集群搭建。

课程视频

如果你需要在本地配置 Spark 完全分布式环境，可以通过查看课程视频来学习。

课程视频《Spark配置文件设置》

Spark分布式安装模式

Spark 分布式环境安装目前有四种模式：

1.Standalone：Spark 自带的简单群资源管理器，安装较为简单，不需要依赖 Hadoop；

2.Hadoop YARN:使用 YARN 作为集群资源管理，安装需要依赖 Hadoop；

3.Apache Mesos:不常用；

4.Kubernetes:不常用。

本地学习测试我们常用 Standalone 模式，生产环境常使用 YARN 模式。

示例集群信息

以下表格为本教程所用示例集群节点信息：

节点名称	节点角色
master	worker，master
slave1	worker
slave2	worker

我们准备了三台虚拟服务器，连接方式如下：文章来源地址https://www.toymoban.com/news/detail-776148.html

服务器	SSH	密码
master	ssh -p 19001 root@localhost	123456
slave1	ssh -p 19

到了这里，关于Spark Standalone 模式的安装和部署第1关： Standalone 分布式集群搭建的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

分布式内存计算Spark环境部署与分布式内存计算Flink环境部署
目录分布式内存计算Spark环境部署 1. 简介 2. 安装 2.1【node1执行】下载并解压 2.2【node1执行】修改配置文件名称 2.3【node1执行】修改配置文件，spark-env.sh 2.4 【node1执行】修改配置文件，slaves 2.5【node1执行】分发 2.6【node2、node3执行】设置软链接 2.7【node1执行】启动Spark集群
2024年02月08日
浏览(57)
Spark单机伪分布式环境搭建、完全分布式环境搭建、Spark-on-yarn模式搭建
搭建Spark需要先配置好scala环境。三种Spark环境搭建互不关联，都是从零开始搭建。如果将文章中的配置文件修改内容复制粘贴的话，所有配置文件添加的内容后面的注释记得删除，可能会报错。保险一点删除最好。上传安装包解压并重命名 rz上传如果没有安装rz可以使用命
2024年02月06日
浏览(45)
部署HDFS集群（完全分布式模式、hadoop用户控制集群、hadoop-3.3.4+安装包）
目录前置一、上传解压（一）上传（二）解压二、修改配置文件（一）配置workers文件（二）配置hadoop-env.sh文件（三）配置core-site.xml文件（四）配置hdfs-site.xml文件三、分发到hp2、hp3, 并设置环境变量（一）准备数据目录（二）配置环境变量四、创建数据目录，并
2024年04月14日
浏览(17)
大数据学习06-Spark分布式集群部署
配置好IP vim /etc/sysconfig/network-scripts/ifcfg-ens33 修改主机名 vi /etc/hostname 做好IP映射 vim /etc/hosts 关闭防火墙 systemctl status firewalld systemctl stop firewalld systemctl disable firewalld 配置SSH免密登录 ssh-keygen -t rsa 下载Scala安装包配置环境变量添加如下配置使环境生效验证 Spark官网解压上
2024年02月10日
浏览(45)
Hadoop（伪分布式）+Spark（local模式）搭建Hadoop和Spark组合环境
环境使用 Ubuntu 14.04 64位作为系统环境（Ubuntu 12.04，Ubuntu16.04 也行，32位、64位均可），请自行安装系统。 Hadoop版本 : Hadoop 2.7.4 创建hadoop用户如果你安装 Ubuntu 的时候不是用的 \\\"hadoop\\\" 用户，那么需要增加一个名为 hadoop 的用户。首先按 ctrl+alt+t 打开终端窗口，输入如下命令创
2023年04月08日
浏览(8)
（大数据开发随笔9）Hadoop 3.3.x分布式环境部署——全分布式模式
分布式文件系统中，HDFS相关的守护进程也分布在不同的机器上，如： NameNode守护进程，尽可能单独部署在一台硬件性能较好的机器中其他的每台机器上都会部署一个DataNode进程，一般的硬件环境即可 SecondaryNameNode守护进程最好不要和NameNode在同一台机器上守护进程布局 Name
2023年04月16日
浏览(11)
ubuntu下Hadoop以及Spark的伪分布式安装：一
1.1 安装前说明：很多初学者在安装的时候会碰到各种各样的问题，尤其各种版本的搭配问题。所以特意做一个初步安装的引导，希望大家都能一次调试出来。经过测试，jdk11 + scala2.13.13 + hadoop3.3.6+spark3.5.1，这是暂时来说scalsa2能支持的最完美的搭配。Hadoop能支持到的java最完
2024年04月23日
浏览(14)
hadoop（伪分布式）上的spark和Scala安装与配置详细版
在搭建spark和Scala前提下，必需安装好hive和java，和 Hadoop的伪分布式哦 1、安装与配置Scale （1）去官网下载Scala 官网地址： The Scala Programming Language (scala-lang.org) https://www.scala-lang.org/ 这里我要的是scala-2.2.12.12.tgz 然后我们点击 all releases 点进去之后往下找然后
2024年04月28日
浏览(13)
Hadoop集群部署-（完全分布式模式，hadoop-2.7.4）
相关软件下载准备：（推荐）虚拟机运行环境：VMware 16.1.1 映像文件：CentOS-7-x86_64-DVD-1810.iso 远程登录工具：Xshell-7.0.0090.exe Xftp传输工具：Xftp-7.0.0111p.exe 首先掌握VMware的下载与安装，有linux学习基础的同学可以略看。参考链接：https://mp.weixin.qq.com/s/CUiauodcjCFPIXEFEx8fOw 【软件名
2024年02月09日
浏览(16)
四种部署模式的优缺点（单机、集群、分布式、微服务）
单机部署含义：所有的业务全部写在一个项目中，部署服务到一台服务器上。单机部署优点：方便开发、学习成本低，方便部署。单机部署缺点：当一个模块出现问题，整个系统全部停止更新。集群部署含义：集群就是单机的“复制”，同一个业务，部署在多个服务器上
2024年02月04日
浏览(15)