hadoop 3.x 案例7: hadoop大数据平台日志

10月前作者：只是甲分类：Toy博客阅读(37) 违法举报

这篇具有很好参考价值的文章主要介绍了hadoop 3.x 案例7: hadoop大数据平台日志。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

一. Hadoop日志

cd $HADOOP_HOME/logs

hadoop 3.x 案例7: hadoop大数据平台日志

日志分类:

namenode日志
datanode日志
secondarynamenode日志
yarn日志
4.1 resourcemanger日志
4.2 nodemanager日志
historyServer日志

1.1 namenode日志

名称节点的日志，如果名称节点有问题，需要进行排查。一个hadoop大数据集群只有一个namenode，具体的信息可以查看配置文件

$HADOOP_HOME/etc/hadoop/core-site.xml

hadoop 3.x 案例7: hadoop大数据平台日志

1.2 datanode日志

一个hadoop大数据平台一般有多个datanode，每个datanode节点都有自己的日志。

$HADOOP_HOME/etc/hadoop/works

hadoop 3.x 案例7: hadoop大数据平台日志

1.3 secondarynamenode日志

我们知道对HDFS进行读写，都需要通过namenode找到对应的datanode，如果集群节点众多且数据量非常大，那么namenode的压力是非常大的，于是诞生了secondarynamenode来分担namenode的压力。

$HADOOP_HOME/etc/hadoop/hdfs-site.xml

hadoop 3.x 案例7: hadoop大数据平台日志

1.4 yarn日志

yarn图解:
hadoop 3.x 案例7: hadoop大数据平台日志

1.4.1 resourcemanger日志

resourcemanger负责全局的资源管理和任务调度，把整个集群当作计算资源池，只关注分配，不管应用，且不负责容错。

$HADOOP_HOME/etc/hadoop/yarn-site.xml

hadoop 3.x 案例7: hadoop大数据平台日志

1.4.2 nodemanager日志

Node节点下的Container管理

启动时向ResourceManager注册并定时发送心跳消息，等待ResourceManger的指令
监控Container的运行，维护Container的生命周期，监控Container的资源使用情况
启动或停止container,管理任务运行时的依赖包（根据APPlicationMaster的需要，启动Container之前将需要的程序以及依赖包，配置文件等COPY到本地）

hadoop 3.x 案例7: hadoop大数据平台日志

注意:
很多时候，我们需要查询nodemananger的日志，从这个地方可以看到我们的任务被分配到那个node了。
hadoop 3.x 案例7: hadoop大数据平台日志

1.5 historyServer日志

当我们重启yarn后，resourcemanger就没办法查看重启前的job运行的历史记录了，此时我们需要从historyServer上查看。

$HADOOP_HOME/etc/hadoop/yarn-site.xml

hadoop 3.x 案例7: hadoop大数据平台日志

hadoop 3.x 案例7: hadoop大数据平台日志

二. Hive日志

Hive的日志比较特殊，$HIVE_HOME 目录是没有logs目录的，其它的组件都是有logs目录的。

Hive的日志在节点(那个节点登陆hive)的/tmp/$username 目录下

例如:

cd /tmp/root
ls
more hive.log

hadoop 3.x 案例7: hadoop大数据平台日志

三. Spark日志

Spark的日志就区分 Master和worker日志

cd $SPARK_HOME/logs

hadoop 3.x 案例7: hadoop大数据平台日志

四. Flink日志

Flink的日志主要是standalone(独立部署)日志和 taskexecutor日志。
如果使用Flink SQL客户端还会有Flink SQL相关的日志。

cd $FLINK_HOME/log

hadoop 3.x 案例7: hadoop大数据平台日志文章来源地址https://www.toymoban.com/news/detail-427391.html

到了这里，关于hadoop 3.x 案例7: hadoop大数据平台日志的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

大数据技术之Hadoop(八)——Flume日志采集系统

目录素材一、Flume的概述 1、Flume的认识 2、Flume的运行机制（1）Source(数据采集器) （2）Channel(缓冲通道) （3）Sink(接收器) 3、Flume的日志采集系统结构（1）简单结构（2）复杂结构二、Flume的基本使用 1、系统要求 2、Flume安装（1）下载Flume （2）解压（3）重命名（4）配置

2024年02月09日
浏览(50)
Hadoop生态圈中的Flume数据日志采集工具

数据采集一般指的是将数据采集到大数据环境下进行持久化、海量化的保存，目的主要是为了我们后期的大数据处理（数据统计分析、数据挖掘等等）沉底数据基础。不同的来源的数据我们一般有不同的数据采集方式 1、数据来源于我们的RDBMS关系型数据库：Sqoop数据迁移工具

2024年02月08日
浏览(46)
大数据技术之Hadoop(十一)——网站流量日志数据分析系统

目录素材：一、模块开发——数据预处理 1、分析预处理的数据 2、实现数据的预处理（1）创建Maven项目，添加相关依赖（2）创建JavaBean对象，封装日志记录（3）创建MapReduce程序，执行数据预处理二、模块开发——数据仓库开发 1、上传文件 2、实现数据仓库三、模块开

2023年04月08日
浏览(34)
【数仓】通过Flume+kafka采集日志数据存储到Hadoop

【数仓】基本概念、知识普及、核心技术【数仓】数据分层概念以及相关逻辑【数仓】Hadoop软件安装及使用（集群配置）【数仓】Hadoop集群配置常用参数说明【数仓】zookeeper软件安装及集群配置【数仓】kafka软件安装及集群配置【数仓】flume软件安装及配置【数仓】flum

2024年03月17日
浏览(60)
Hadoop大数据平台搭建（超详细步骤）

相关软件下载链接： Xshell：家庭/学校免费 - NetSarang Website Xftp：家庭/学校免费 - NetSarang Website Xshell与Xftp官网：XSHELL - NetSarang Website Jdk：百度网盘请输入提取码提取码：jdhp Hadoop：百度网盘请输入提取码提取码：jdhp 需要配置好的虚拟机与相关环境的，可以点击我的这篇

2023年04月12日
浏览(78)
基于Hadoop的数据分析案例-陌陌聊天软件数据分析

目录前言一、使用的工具二、操作步骤 1.数据来源 2.数据内容分析 3.加载数据 4.数据清洗ETL 5.数据分析 8.数据可视化本文章是使用基于Hadoop的数据仓库Hive针对陌陌聊天软件进行数据分析并可视化。 Vmware Workstation Pro Centos 7 64bit FinalShell 3.9.2.2 DataGrip 2020.1 x64 Tableau 2021.

2024年02月06日
浏览(46)
大数据平台搭建——hadoop集群（基于CentOS-7）的搭建

目录总序一、下载相关软件的压缩包二、配置虚拟机上主节点相关设置 1、修改主机用户名 2、进行ip地址映射 3、配置虚拟机网络设置三、解压并配置java、hadoop环境 1、解压jdk、hadoop压缩文件 2、配置jdk、hadoop环境 3、修改hadoop中的相关配置文件信息（最重要）四、克隆

2024年02月06日
浏览(47)
大数据与云计算——部署Hadoop集群并运行MapReduce集群案例(超级详细！)

Linux搭建Hadoop集群(CentOS7+hadoop3.2.0+JDK1.8+Mapreduce完全分布式集群) 本文所用到的版本号： CentOS7 Hadoop3.2.0 JDK1.8 基本概念及重要性很多小伙伴部署集群用hadoop用mapreduce，却不知道到底部署了什么，有什么用。在部署集群之前先给大家讲一下Hadoop和MapReduce的基本概念，以及它们在大

2024年02月04日
浏览(46)
大数据平台运维（hadoop入门（保姆篇））----概述及基本环境配置(HA-1)

2022.12.4 大数据运维基础篇本章主要是基础坏境配置目录前言一、hadoop是什么？ 1.1 Hadoop 是什么 1.2 Hadoop 优势 1.3 Hadoop 组成二、大数据技术体系 2.1 HDFS 架构概述Hadoop Distributed File System，简称HDFS，是一个分布式文件系统。 2.2 YARN 架构概述 2.3 MapRed

2024年02月08日
浏览(51)
Hadoop3.0大数据处理学习4（案例：数据清洗、数据指标统计、任务脚本封装、Sqoop导出Mysql）

直播公司每日都会产生海量的直播数据，为了更好地服务主播与用户，提高直播质量与用户粘性，往往会对大量的数据进行分析与统计，从中挖掘商业价值，我们将通过一个实战案例，来使用Hadoop技术来实现对直播数据的统计与分析。下面是简化的日志文件，详细的我会更新

2024年02月08日
浏览(53)