spark启动HA时workers为0，且为standby状态

9月前作者：白莲居仙分类：Toy博客阅读(25) 违法举报

这篇具有很好参考价值的文章主要介绍了spark启动HA时workers为0，且为standby状态。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

今天学习一个spark视频，在启动StandAloneHa模式的时候，发现workers为0，而且spark两个master的状态都为standby，找了很久，才知道我用的spark3.2 最低支撑的zookeeper版本为3.5.x,而且zookeeper的安装包是需要带bin的那个包，例如apache-zookeeper-3.6.3-bin.tar.gz
这是zookeeper下载的地址：zookeeper下载地址
我自己用的是3.6.3版本

下图为解决后的样子
spark启动HA时workers为0，且为standby状态,spark,大数据,分布式文章来源地址https://www.toymoban.com/news/detail-574263.html

到了这里，关于spark启动HA时workers为0，且为standby状态的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Spark弹性分布式数据集

1. Spark RDD是什么 RDD（Resilient Distributed Dataset，弹性分布式数据集）是一个不可变的分布式对象集合，是Spark中最基本的数据抽象。在代码中RDD是一个抽象类，代表一个弹性的、不可变、可分区、里面的元素可并行计算的集合。每个RDD都被分为多个分区，这些分区运行在集群中

2024年02月13日
浏览(60)
Spark大数据分析与实战笔记（第三章 Spark RDD 弹性分布式数据集-02）

人生很长，不必慌张。你未长大，我要担当。传统的MapReduce虽然具有自动容错、平衡负载和可拓展性的优点，但是其最大缺点是采用非循环式的数据流模型，使得在迭代计算式要进行大量的磁盘IO操作。Spark中的RDD可以很好的解决这一缺点。 RDD是Spark提供的最重要的抽象概念

2024年02月22日
浏览(96)
pytorch 分布式 Node/Worker/Rank等基础概念

分布式训练相关基本参数的概念如下: Definitions Node - A physical instance or a container; maps to the unit that the job manager works with. Worker - A worker in the context of distributed training. WorkerGroup - The set of workers that execute the same function (e.g. trainers). LocalWorkerGroup - A subset of the workers in the worker g

2024年02月02日
浏览(48)
大数据开发之Spark（RDD弹性分布式数据集）

rdd（resilient distributed dataset）叫做弹性分布式数据集，是spark中最基本的数据抽象。代码中是一个抽象类，它代表一个弹性的、不可变、可分区、里面的元素可并行计算的集合。 1.1.1 rdd类比工厂生产 1.1.2 wordcount工作流程 1、一组分区（partition），即是数据集的基本组成单位，

2024年01月24日
浏览(71)
大数据学习06-Spark分布式集群部署

配置好IP vim /etc/sysconfig/network-scripts/ifcfg-ens33 修改主机名 vi /etc/hostname 做好IP映射 vim /etc/hosts 关闭防火墙 systemctl status firewalld systemctl stop firewalld systemctl disable firewalld 配置SSH免密登录 ssh-keygen -t rsa 下载Scala安装包配置环境变量添加如下配置使环境生效验证 Spark官网解压上

2024年02月10日
浏览(70)
大数据课程K2——Spark的RDD弹性分布式数据集

文章作者邮箱：yugongshiye@sina.cn 地址：广东惠州 ⚪ 了解Spark的RDD结构； ⚪ 掌握Spark的RDD操作方法； ⚪ 掌握Spark的RDD常用变换方法、常用执行方法；初学Spark时，把RDD看做是一个集合类型（类似于Array或List），用于存储数据和操作数据，但RDD和普通集合的区别

2024年02月12日
浏览(55)
使用Akka的Actor模拟Spark的Master和Worker工作机制

在 Apache Spark 中，Master 和 Worker 之间通过心跳机制进行通信和保持活动状态。下面是 Master 和 Worker 之间心跳机制的工作流程： Worker 启动后，会向预先配置的 Master 节点发送注册请求。 Master 接收到注册请求后，会为该 Worker 创建一个唯一的标识符（Worker ID）并将其信息保存在

2024年02月09日
浏览(40)
Hadoop-HA-Hive-on-Spark 4台虚拟机安装配置文件

apache-hive-3.1.3-bin.tar spark-3.0.0-bin-hadoop3.2.tgz hadoop-3.1.3.tar.gz 在hdfs上新建 spark-history（设置权限777），spark-jars文件夹上传jar到hdfs 链接hadoop中的文件 ln -s 源文件名新文件名链接hive中的文件 ln -s 源文件名新文件名链接hadoop中的文件 ln -s 源文件名新文件名

2024年02月07日
浏览(44)
大数据开源框架环境搭建(七)——Spark完全分布式集群的安装部署

前言：七八九用于Spark的编程实验大数据开源框架之基于Spark的气象数据处理与分析_木子一个Lee的博客-CSDN博客_spark舆情分析目录实验环境：实验步骤：一、解压二、配置环境变量：三、修改配置文件 1.修改spark-env.sh配置文件： 2.修改配置文件slaves: 3.分发配置文件：

2024年02月11日
浏览(54)
云计算与大数据第16章分布式内存计算平台Spark习题

1、Spark是Hadoop生态（ B ）组件的替代方案。 A. Hadoop B. MapReduce C. Yarn D．HDFS 2、以下（ D ）不是Spark的主要组件。 A. Driver B. SparkContext C. ClusterManager D. ResourceManager 3、Spark中的Executor是（ A ）。 A．执行器 B．主节

2024年02月14日
浏览(119)