Spark---Master启动及Submit任务提交-Toy模板网

这篇具有很好参考价值的文章主要介绍了Spark---Master启动及Submit任务提交。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

一、Spark Master启动

1、Spark资源任务调度对象关系图

怎么启动master,Spark,spark,大数据,分布式

2、集群启动过程

Spark集群启动之后，首先调用$SPARK_HOME/sbin/start-all.sh，start-all.sh脚本中调用了“start-master.sh”脚本和“start-slaves.sh”脚本，在start-master.sh脚本中可以看到启动Master角色的主类：“org.apache.spark.deploy.master.Master”。在对应的start-slaves.sh脚本中又调用了start-slave.sh脚本，在star-slave.sh脚本中可以看到启动Worker角色的主类：“org.apache.spark.deploy.worker.Worker”。

Master&Worker启动

Spark框架的设计思想是每台节点上都会启动对应的Netty通信环境，叫做RpcEnv通信环境。每个角色启动之前首先向NettyRpcEnv环境中注册对应的Endpoint，然后启动。角色包括：Master，Worker,Driver,Executor等。下图是启动start-all集群后，Master角色启动过程，Master角色的启动会调用“org.apache.spark.deploy.master.Master”主类，执行流程如下：

怎么启动master,Spark,spark,大数据,分布式

二、Spark Submit任务提交

SparkSubmit任务提交

Spark submit提交任务时，调用$SPARK_HOME/bin/spark-submit spark-submit脚本中调用了“org.apache.spark.deploy.SparkSubmit”类。执行此类时，首先运行main方法进行参数设置，然后向Master申请启动Driver。代码流程如下图示：

怎么启动master,Spark,spark,大数据,分布式