Spark on Yarn 最佳运行参数调优-计算方式_spark on yarn 调优 nodemanager-Toy模板网

这篇具有很好参考价值的文章主要介绍了Spark on Yarn 最佳运行参数调优-计算方式_spark on yarn 调优 nodemanager。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7

深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新软件测试全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
Spark on Yarn 最佳运行参数调优-计算方式_spark on yarn 调优 nodemanager,2024年程序员学习,spark,大数据,分布式

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上软件测试知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

如果你需要这些资料，可以添加V获取：vip1024b （备注软件测试）
Spark on Yarn 最佳运行参数调优-计算方式_spark on yarn 调优 nodemanager,2024年程序员学习,spark,大数据,分布式

正文

Spark on Yarn 参数调优-计算方式

1. 整理机器信息

机器数： 3台

查看物理CPU个数

查看每个物理CPU中core的个数(即核数)

cat /proc/cpuinfo| grep “cpu cores”| uniq
或者grep ‘core id’ /proc/cpuinfo | sort -u | wc -l
每台机器都是单核处理器

查看逻辑CPU的个数

cat /proc/cpuinfo| grep “processor”| wc -l
或者grep ‘processor’ /proc/cpuinfo | sort -u | wc -l
每台机器核数：8核

查看CPU信息（型号）

cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c
查看结果：8 Intel® Xeon® CPU E5-2630 v4 @ 2.20GHz

内存自由状态信息

master : 22 当做20
worker1: 26 当做25
worker2: 26 当做25

Top命令查看内存信息

Spark on Yarn 最佳运行参数调优-计算方式_spark on yarn 调优 nodemanager,2024年程序员学习,spark,大数据,分布式

Free -h命令查看内存信息（人性化显示）
cdh-master

Spark on Yarn 最佳运行参数调优-计算方式_spark on yarn 调优 nodemanager,2024年程序员学习,spark,大数据,分布式

cdh-worker1

Spark on Yarn 最佳运行参数调优-计算方式_spark on yarn 调优 nodemanager,2024年程序员学习,spark,大数据,分布式

cdh-worker2

Spark on Yarn 最佳运行参数调优-计算方式_spark on yarn 调优 nodemanager,2024年程序员学习,spark,大数据,分布式

计算参考因素

2.1 Yarn ApplicationMaster（AM）：

AM负责从ResourceManager申请资源，与NodeManager进行通信启动/停
止任务，监控资源的使用。在Yarn上执行Spark也要考虑AM所需资源（1G
和 1个Executor）。

2.2 HDFS Throughput：

HDFS Client有多个并发线程写的问题，HDFS每个Executor的使用5个任
务就可获取完全并发写。因此最好每个Executor的cores不高于5.

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以添加V获取：vip1024b （备注软件测试）
Spark on Yarn 最佳运行参数调优-计算方式_spark on yarn 调优 nodemanager,2024年程序员学习,spark,大数据,分布式

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！
-1713161028969)]

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！文章来源地址https://www.toymoban.com/news/detail-858317.html

到了这里，关于Spark on Yarn 最佳运行参数调优-计算方式_spark on yarn 调优 nodemanager的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！