Yarn安装及配置一件启停

这篇具有很好参考价值的文章主要介绍了Yarn安装及配置一件启停。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Yarn安装及配置一件启停

数据、程序、运算资源(内存、CPU)三者组在一起,才能完成数据的计算处理过程。在单机环境下,三者之间协调配合不是太大问题。为了应对海量数据的处理场景,Hadoop软件出现并提供了分布式处理思想。但是在分布式环境下的三者如何协调好将成为关键。在Hadoop1.x的时候 MapReduce既负责数据的运算,又负责资源的管理.在Hadoop2.x的版本拆分MapReduce,剥离出资源管理成为单独框架,YARN闪亮登场,MapReduce专注于数据处理,两者解耦合。YARN被设计用以解决以往架构的需求和缺陷的**资源管理**和**调度软件**。
Yarn安装及配置一件启停

Hadoop 1.x 版本主要架构模型

JobTracker :一个中央守护进程,负责运行集群上的所有作业。
TaskTracker:系统里的从进程,根据JobTracker的指令来执行任务

JobTracker身兼多职、压力大(作业数据管理、作业状态记录、作业调度)、可靠性和可用性欠缺(JobTracker单点故障)、计算模型单一。MapReduce框架本身需要迭代优化。但是计算和资源管理绑定在了一起,使得MapReduce的演变比较困难。
Yarn安装及配置一件启停

什么是Yarn

Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统调度平台,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。

资源管理系统:集群的硬件资源,和程序运行相关,比如内存,CPU等

调度平台:多个程序同时申请计算资源如何分配,调度的规则(算法)。

通用∶不仅仅支持MapReduce程序,理论上支持各种计算程序。YARN不关心你干什么,只关心你要资源,在有的情况下给你,用完之后还我。

可以把Hadoop YARN理解为相当于一个分布式的操作系统平台,而MapReduce等计算程序则相当于运行于操作系统之上的应用程序,YARN为这些程序提供运算所需的资源(内存、CPU等)。

Hadoop能有今天这个地位,YARN可以说是功不可没。因为有了YARN,更多计算框架可以接入到 HDFS中,而不单单是MapReduce,正式因为YARN的包容,使得其他计算框架能专注于计算性能的提升。
HDFS可能不是最优秀的大数据存储系统,但却是应用最广泛的大数据存储系统,YARN功不可没。
Yarn安装及配置一件启停

Yarn架构体系

Yarn安装及配置一件启停
主从架构
也是采用 master(Resource Manager)- slave (Node Manager)架构,Resource Manager 整个集群只有一个,一个可靠的节点。

1、 每个节点上可以负责该节点上的资源管理以及任务调度,Node Manager 会定时向Resource Manager汇报本节点上 的资源使用情况和任务运行状态,
2、 Resource Manager会通过心跳应答的机制向Node Manager下达命令或者分发新的任务,
3、 Yarn 将某一资源分配给该应用程序后,应用程序会启动一个Application Master,
4、 Application Master为应用程序负责向Resource Manager申请资源,申请资源之后,再和申请到的节点进行通信,运行内部任务。

Resource Manager

RM是一个全局的资源管理器,负责整个系统的资源管理和分配。它主要由两个组件构成:调度器(Scheduler)和应用程序管理器(Applications Manager,ASM)。

Schedule 资源调度器是一个可插拔的组件,用户可根据自己需要设计资新的源调度器,YARN提供多个可直接使用的资源调度器。资源调度器将系统中的资源分配给正在运行的程序,不负责监控或跟踪应用的执行状态,不负责重启失败的任务

Applications Manager 应用程序管理器负责管理整个系统中所有应用程序,包括应用程序提交、与调度器协商资源以启动ApplicationMaster、监控ApplicationMaster运行状态并在失败时重新启动它等。

Node Manager

NM是每个节点上的资源和任务管理器,一方面,它会定时地向RM汇报本节点上的资源使用情况和各个Container的运行状态;另一方面,它接收并处理来自AM的Container启动/停止等各种请求。

ApplicationMaster

用户提交的每个应用程序均包含一个AM,主要功能包括:

1.与RM调度器协商以获取资源(用Container表示);

2.将得到的任务进一步分配给内部的任务

3.与NM通信以启动/停止任务;

4.监控所有任务运行状态,并在任务运行失败时重新为任务申请资源以重启任务。

注:RM只负责监控AM,在AM运行失败时候启动它,RM并不负责AM内部任务的容错,这由AM来完成。

Container

Container是YARN中的资源抽象,它封装了某个节点上的多维度资源,如内存、CPU、磁盘、网络等,当AM向RM申请资源时,RM为AM返回的资源便是用Container表示。YARN会为每个任务分配一个Container,且该任务只能使用该Container中描述的资源。yarn的container容器是yarn虚拟出来的一个东西,属于虚拟化的,它是由memory+vcore组成,是专门用来运行任务的

Yarn的安装

etc/hadoop/目录下 yarn-site.xml文件
vi yarn-site.xml 文章来源地址https://www.toymoban.com/news/detail-444562.html

<!--  resource,manager主节点所在机器 -->
<property>
	<name>yarn.resourcemanager.hostname</name>
	<value>linux01</value>
</property>

<!--  为mr程序提供shuffle服务 -->
<property>
	<name>yarn.nodemanager.aux-services</name>
	<value>mapreduce_shuffle</value>
</property>

<!--  一台NodeManager的总可用内存资源 -->
<property>
	<name>yarn.nodemanager.resource.memory-mb</name>
	<value>4096</value>
</property>
<!--  一台NodeManager的总可用(逻辑)cpu核数 -->
<property>
	<name>yarn.nodemanager.resource.cpu-vcores</name>
	<value>4</value>
</property>

<!--  是否检查容器的虚拟内存使用超标情况
	 vmem为true 指的是默认检查虚拟内存,容器使用的虚拟内存不能超过我们设置的虚拟内存大小 
-->
<property>
  	<name>yarn.nodemanager.vmem-check-enabled</name>
  	<value>false</value>
</property>

<!--  容器的虚拟内存使用上限:与物理内存的比率 --> 	
<property>
  	<name>yarn.nodemanager.vmem-pmem-ratio</name>
  	<value>2.1</value>
</property>


将 yarn-site.xml 同步给其他Linux
scp yarn-site.xml linux02:$PWD
scp yarn-site.xml linux03:$PWD

配置一键启停

cd /opt/apps/hadoop-3.1.1/sbin
vi  start-yarn.sh
vi  stop-yarn.sh

YARN_RESOURCEMANAGER_USER=root 
HADOOP_SECURE_DN_USER=yarn 
YARN_NODEMANAGER_USER=root

start-yarn.sh  一键启动 

启动后可以访问  http://linux01:8088 查看页面


解决linux连接部上 网卡出现问题 
systemctl stop  NetworkManager
systemctl diable  NetworkManager
systemctl restart network

到了这里,关于Yarn安装及配置一件启停的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • nvm, node.js, npm, yarn 安装配置

    nvm 是一个 node.js 管理工具,可以快捷下载安装使用多个版本的node.js linux 命令行输入: 卸载: 删除 ~/.bashrc 文件中的 windows 点击 github 链接 windows-releases, 下载下方红框中的exe文件安装即可 卸载找到安装目录中的uninstall文件即可 node.js 是 js 文件的运行环境 linux windows npm, yarn

    2024年01月20日
    浏览(51)
  • hadoop安装之保姆级教程(二)之YARN的配置

      为克服 Hadoop 1.0 中 HDFS 和 MapReduce 存在的各种问题⽽提出的,针对 Hadoop 1.0 中的 MapReduce 在扩展性和多框架⽀持⽅⾯的不⾜,提出了全新的资源管理框架YARN.   Apache YARN ( Yet another Resource Negotiator 的缩写)是 Hadoop 集群的资源管理系统,负责为计算程序提供服务器计算资源,

    2024年02月14日
    浏览(32)
  • 【运维】hadoop 集群安装(三)hdfs、yarn集群配置、nodemanager健康管理讲解

    上篇简单说明了多节点的hadoop节点怎么安装,但是没有细致的分析hadoop相关配置,具体怎么根据环境进行配置,接下来我们对这些配置进行讲解 Daemon Environment Variable NameNode HDFS_NAMENODE_OPTS DataNode HDFS_DATANODE_OPTS Secondary NameNode HDFS_SECONDARYNAMENODE_OPTS ResourceManager YARN_RESOURCEMANAGER_OP

    2024年02月10日
    浏览(33)
  • 【C#】Windows服务(Service)安装及启停

    目录 一、创作背景 二、问题解决 2.1 安装Windows service服务 2.2 主方法Main()主方法改写 2.3 安装service服务/卸载service服务 2.4 服务启停 2.5 服务调用运行 2.6 关于权限的提升 三、资源分享 3.1 引入组件 3.2 新手使用 我能抽象出整个世界,但是我不能抽象你。 想让你成为私有常量,

    2023年04月08日
    浏览(31)
  • ubuntu 22.04配置开发环境 [Fcitx5中文输入法+配置 & 迁移vscode & 安装flameshot & 微信 & mysql &workbench & yarn工具 & zsh]

    一、安装Fcitx5 最简单三步骤,把下面的命令都跑一遍之后重启电脑,不要去下载搜狗输入法,非常垃圾 Fcitx 5 主程序 中文输入法引擎 图形界面相关 转载自掘金 二、安装 配置 vscode 安装的两种方法: 官网选择deb安装包 cd进安装包目录运行 直接在ubuntu software里搜索vscode安装

    2024年01月21日
    浏览(34)
  • 把一件事情说清楚即可,把一件事做完即可

    这不是一篇技术文章,是一篇随笔。 没有代码,也没有图表。 是流淌的思绪。 我自己从大学开始才开始接触做PPT。现在的小孩可能小学、甚至幼儿园就开始跟着大人做PPT。从开始做PPT的第一天开始,怎样做好一个PPT总是困扰着我,一直到最近我才想明白了一个朴素的道理。

    2024年02月12日
    浏览(27)
  • Flink配置Yarn日志聚合、配置历史日志。

    对于已经结束的yarn应用,flink进程已经退出无法提供webui服务。所以需要通过JobHistoryServer查看保留在yarn上的日志。 下面就给大家分享一下我在配置方面的经历吧。 1.yarn配置聚合日志 编辑 :yarn-site.xml 说明 : 开启后任务执行 “完毕” 后,才会上传日志至hdfs 查询 :yarn lo

    2024年02月10日
    浏览(23)
  • yarn配置淘宝镜像

    1.查询当前配置的镜像 2.设置成淘宝镜像 3.换成原来的 1.查询当前配置的镜像 2.设置成淘宝镜像 3.换成原来的

    2024年02月12日
    浏览(26)
  • Yarn 配置管理

    此处的Yarn不是Apache Hadoop YARN,而是facebook发布的一款取代npm的包管理工具。安装 Yarn 工具,首先需要安装 nodejs。node下载地址:node 安装包官方下载地址。nodejs 安装完成后,执行下边命令安装 Yarn 工具: 查看镜像仓库地址 修改镜像源地址 常见镜像仓库有: 淘宝镜像仓库:ht

    2024年02月16日
    浏览(26)
  • yarn资源配置及使用

    目录 1.简介 2.调度器 1.FIFO Scheduler 2.Capacity Scheduler 1.介绍 2.capacity调度器的特性 4.配置demo 3.Fair Scheduler 4.yarn调度器对比 理想情况下,应用提交到yarn上立马就可以获得资源执行任务,但是现实情况资源往往是有限的,任务执行的先后及获得资源的多少,yarn给我们提供了多种调

    2023年04月08日
    浏览(20)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包