hadoop 3.x 案例7: hadoop大数据平台日志

这篇具有很好参考价值的文章主要介绍了hadoop 3.x 案例7: hadoop大数据平台日志。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一. Hadoop日志

cd $HADOOP_HOME/logs

hadoop 3.x 案例7: hadoop大数据平台日志

日志分类:

  1. namenode日志

  2. datanode日志

  3. secondarynamenode日志

  4. yarn日志
    4.1 resourcemanger日志
    4.2 nodemanager日志

  5. historyServer日志

1.1 namenode日志

名称节点的日志,如果名称节点有问题,需要进行排查。一个hadoop大数据集群只有一个namenode,具体的信息可以查看配置文件

$HADOOP_HOME/etc/hadoop/core-site.xml  

hadoop 3.x 案例7: hadoop大数据平台日志

1.2 datanode日志

一个hadoop大数据平台一般有多个datanode,每个datanode节点都有自己的日志。

$HADOOP_HOME/etc/hadoop/works

hadoop 3.x 案例7: hadoop大数据平台日志

1.3 secondarynamenode日志

我们知道对HDFS进行读写,都需要通过namenode找到对应的datanode,如果集群节点众多且数据量非常大,那么namenode的压力是非常大的,于是诞生了secondarynamenode来分担namenode的压力。

$HADOOP_HOME/etc/hadoop/hdfs-site.xml

hadoop 3.x 案例7: hadoop大数据平台日志

1.4 yarn日志

yarn图解:
hadoop 3.x 案例7: hadoop大数据平台日志

1.4.1 resourcemanger日志

resourcemanger负责全局的资源管理和任务调度,把整个集群当作计算资源池,只关注分配,不管应用,且不负责容错。

$HADOOP_HOME/etc/hadoop/yarn-site.xml 

hadoop 3.x 案例7: hadoop大数据平台日志

1.4.2 nodemanager日志

Node节点下的Container管理

  1. 启动时向ResourceManager注册并定时发送心跳消息,等待ResourceManger的指令

  2. 监控Container的运行,维护Container的生命周期,监控Container的资源使用情况

  3. 启动或停止container,管理任务运行时的依赖包(根据APPlicationMaster的需要,启动Container之前将需要的程序以及依赖包,配置文件等COPY到本地)

hadoop 3.x 案例7: hadoop大数据平台日志

注意:
很多时候,我们需要查询nodemananger的日志,从这个地方可以看到我们的任务被分配到那个node了。
hadoop 3.x 案例7: hadoop大数据平台日志

1.5 historyServer日志

当我们重启yarn后,resourcemanger就没办法查看重启前的job运行的历史记录了,此时我们需要从historyServer上查看。

$HADOOP_HOME/etc/hadoop/yarn-site.xml

hadoop 3.x 案例7: hadoop大数据平台日志

hadoop 3.x 案例7: hadoop大数据平台日志

二. Hive日志

Hive的日志比较特殊,$HIVE_HOME 目录是没有logs目录的,其它的组件都是有logs目录的。

Hive的日志在节点(那个节点登陆hive)的/tmp/$username 目录下

例如:

cd /tmp/root
ls
more hive.log

hadoop 3.x 案例7: hadoop大数据平台日志

三. Spark日志

Spark的日志就区分 Master和worker日志

cd $SPARK_HOME/logs

hadoop 3.x 案例7: hadoop大数据平台日志

四. Flink日志

Flink的日志 主要是standalone(独立部署)日志和 taskexecutor日志。
如果使用Flink SQL客户端还会有Flink SQL相关的日志。

cd $FLINK_HOME/log

hadoop 3.x 案例7: hadoop大数据平台日志文章来源地址https://www.toymoban.com/news/detail-427391.html

到了这里,关于hadoop 3.x 案例7: hadoop大数据平台日志的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Hadoop生态圈中的Flume数据日志采集工具

    数据采集一般指的是将数据采集到大数据环境下进行持久化、海量化的保存,目的主要是为了我们后期的大数据处理(数据统计分析、数据挖掘等等)沉底数据基础。 不同的来源的数据我们一般有不同的数据采集方式 1、数据来源于我们的RDBMS关系型数据库:Sqoop数据迁移工具

    2024年02月08日
    浏览(45)
  • 大数据技术之Hadoop(八)——Flume日志采集系统

    目录 素材 一、Flume的概述 1、Flume的认识 2、Flume的运行机制 (1)Source(数据采集器) (2)Channel(缓冲通道) (3)Sink(接收器) 3、Flume的日志采集系统结构 (1)简单结构 (2)复杂结构 二、Flume的基本使用 1、系统要求 2、Flume安装 (1)下载Flume (2)解压 (3)重命名 (4)配置

    2024年02月09日
    浏览(46)
  • 大数据技术之Hadoop(十一)——网站流量日志数据分析系统

    目录 素材: 一、模块开发——数据预处理 1、分析预处理的数据 2、实现数据的预处理 (1)创建Maven项目,添加相关依赖 (2)创建JavaBean对象,封装日志记录 (3)创建MapReduce程序,执行数据预处理  二、模块开发——数据仓库开发 1、上传文件 2、实现数据仓库 三、模块开

    2023年04月08日
    浏览(31)
  • 【数仓】通过Flume+kafka采集日志数据存储到Hadoop

    【数仓】基本概念、知识普及、核心技术 【数仓】数据分层概念以及相关逻辑 【数仓】Hadoop软件安装及使用(集群配置) 【数仓】Hadoop集群配置常用参数说明 【数仓】zookeeper软件安装及集群配置 【数仓】kafka软件安装及集群配置 【数仓】flume软件安装及配置 【数仓】flum

    2024年03月17日
    浏览(59)
  • Hadoop大数据平台搭建(超详细步骤)

    相关软件下载链接: Xshell:家庭/学校免费 - NetSarang Website Xftp:家庭/学校免费 - NetSarang Website Xshell与Xftp官网:XSHELL - NetSarang Website Jdk:百度网盘 请输入提取码  提取码:jdhp Hadoop:百度网盘 请输入提取码   提取码:jdhp 需要配置好的虚拟机与相关环境的,可以点击我的这篇

    2023年04月12日
    浏览(77)
  • 基于Hadoop的数据分析案例-陌陌聊天软件数据分析

    目录 前言 一、使用的工具 二、操作步骤 1.数据来源 2.数据内容分析  3.加载数据  4.数据清洗ETL  5.数据分析 8.数据可视化 本文章是使用基于Hadoop的数据仓库Hive针对陌陌聊天软件进行数据分析并可视化。 Vmware Workstation Pro Centos 7 64bit FinalShell 3.9.2.2 DataGrip 2020.1 x64 Tableau 2021.

    2024年02月06日
    浏览(42)
  • 大数据平台搭建——hadoop集群(基于CentOS-7)的搭建

    目录 总序 一、下载相关软件的压缩包 二、配置虚拟机上主节点相关设置 1、修改主机用户名 2、进行ip地址映射 3、配置虚拟机网络设置   三、解压并配置java、hadoop环境 1、解压jdk、hadoop压缩文件  2、配置jdk、hadoop环境 3、修改hadoop中的相关配置文件信息(最重要) 四、克隆

    2024年02月06日
    浏览(46)
  • 大数据与云计算——部署Hadoop集群并运行MapReduce集群案例(超级详细!)

    Linux搭建Hadoop集群(CentOS7+hadoop3.2.0+JDK1.8+Mapreduce完全分布式集群) 本文所用到的版本号: CentOS7 Hadoop3.2.0 JDK1.8 基本概念及重要性 很多小伙伴部署集群用hadoop用mapreduce,却不知道到底部署了什么,有什么用。在部署集群之前先给大家讲一下Hadoop和MapReduce的基本概念,以及它们在大

    2024年02月04日
    浏览(46)
  • 大数据平台运维(hadoop入门(保姆篇))----概述及基本环境配置(HA-1)

    2022.12.4  大数据运维基础篇 本章主要是基础坏境配置 目录 前言  一、hadoop是什么? 1.1 Hadoop 是什么 1.2 Hadoop 优势 1.3 Hadoop 组成  二、大数据技术体系                   2.1 HDFS 架构概述Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。 2.2 YARN 架构概述 2.3 MapRed

    2024年02月08日
    浏览(49)
  • Hadoop3.0大数据处理学习4(案例:数据清洗、数据指标统计、任务脚本封装、Sqoop导出Mysql)

    直播公司每日都会产生海量的直播数据,为了更好地服务主播与用户,提高直播质量与用户粘性,往往会对大量的数据进行分析与统计,从中挖掘商业价值,我们将通过一个实战案例,来使用Hadoop技术来实现对直播数据的统计与分析。下面是简化的日志文件,详细的我会更新

    2024年02月08日
    浏览(49)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包