flume环境配置-传输Hadoop日志(namenode或datanode日志)

这篇具有很好参考价值的文章主要介绍了flume环境配置-传输Hadoop日志(namenode或datanode日志)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

解压文件

修改文件名

 配置环境变量

执行flume-ng version 

将flume-env.sh.template改名为flume-env.sh, 并修改其配置

启动Flume传输Hadoop日志

启动flume 


解压文件

tar -zxvf apache-flume-1.9.0-bin.tar.gz -C /opt/module

修改文件名

mv apache-flume-1.9.0-bin flume

 配置环境变量

vim /etc/profile
export FLUME_HOME=/opt/module/flume
export PATH=$FLUME_HOME/bin
source /etc/profile

执行flume-ng version 

flume环境配置-传输Hadoop日志(namenode或datanode日志)

将flume-env.sh.template改名为flume-env.sh, 并修改其配置

         在flume/conf目录下

cp flume-env.sh.template flume-env.sh
vi flume/conf/flume-env.sh 
export JAVA_HOME=/opt/jdk1.8

        配置文件监控NameNode 日志文件

        flume/conf目录下

cp flume-conf.properties.template flume-conf.properties

        在 Hadoop 的默认配置下,NameNode 的日志文件位于 $HADOOP_HOME/logs/hadoop-hdfs-namenode-[hostname].log。

其中,$HADOOP_HOME 为 Hadoop 的安装目录,[hostname] 为运行 NameNode 的主机名。如果启用了安全模式,还会有一个专门的安全模式日志文件,路径为 $HADOOP_HOME/logs/hadoop-hdfs-namenode-[hostname]-safemode.log。

vim flume-conf.properties
a1.sources = r1
a1.sinks = k1
a1.channels = c1

a1.sources.r1.type = exec
a1.sources.r1.command = tail -F /opt/module/hadoop-3.1.3/logs/hadoop-root-namenode-master.log

a1.sinks.k1.type = hdfs
a1.sinks.k1.hdfs.path = hdfs://master:9000/tmp/flume/%Y%m%d
a1.sinks.k1.hdfs.filePrefix = log-
a1.sinks.k1.hdfs.fileType = DataStream
a1.sinks.k1.hdfs.useLocalTimeStamp = true

a1.channels.c1.type = memory
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

启动Flume传输Hadoop日志

       flume必须持有hadoop相关的包才能将数据输出到hdfs, 将如下包上传到flume/lib下 

cp $HADOOP_HOME/share/hadoop/common/hadoop-common-3.1.3.jar  /opt/flume/lib
cp $HADOOP_HOME/share/hadoop/common/lib/hadoop-auth-3.1.3.jar /opt/flume/lib
cp $HADOOP_HOME/share/hadoop/common/lib/commons-configuration2-2.1.1.jar /opt/flume/lib

        将hadoop的hdfs-site.xml和core-site.xml 放到flume/conf下

cp $HADOOP_HOME/etc/hadoop/core-site.xml //opt/flume/conf
cp $HADOOP_HOME/etc/hadoop/hdfs-site.xml //opt/flume/conf

        flume-1.9.0/conf目录下

 rm /opt/flume-1.9.0/lib/guava-11.0.2.jar

启动flume 

flume-ng agent --conf conf/ --conf-file /opt/flume/conf/flume-conf.properties --name a1  -Dflume.root.logger=DEBUG,console

        在hdfs上查看内容

flume环境配置-传输Hadoop日志(namenode或datanode日志)

hdfs dfs -ls /tmp/flume

flume环境配置-传输Hadoop日志(namenode或datanode日志)

flume环境配置-传输Hadoop日志(namenode或datanode日志)文章来源地址https://www.toymoban.com/news/detail-491718.html

到了这里,关于flume环境配置-传输Hadoop日志(namenode或datanode日志)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Hadoop高手之路8-Flume日志采集

    在大数据系统的开发中,数据收集工作无疑是开发者首要解决的一个难题,但由于生产数据的源头丰富多样,其中包含网站日志数据、后台监控数据、用户浏览网页数据等,数据工程师要想将它们分门别类的采集到HDFS系统中,就可以使用Apache Flume(数据采集)系统。 1. Flum

    2024年02月05日
    浏览(47)
  • Hadoop启动后没有NameNode进程,日志报ulimit -a for user root

    环境:CentOS7、Hadoop2.6.4 背景:安装后启动正常,一段时间在来启动发生这种情况。 现象:         启动后没有NameNode进程,于是查看日志,日志显示ulimit -a for user root,潜意识还以为文件不能读。( 坑1 )查看网上资料,说是同时打开文件描述符数量受限,于是更改参数

    2024年02月15日
    浏览(44)
  • Hadoop生态圈中的Flume数据日志采集工具

    数据采集一般指的是将数据采集到大数据环境下进行持久化、海量化的保存,目的主要是为了我们后期的大数据处理(数据统计分析、数据挖掘等等)沉底数据基础。 不同的来源的数据我们一般有不同的数据采集方式 1、数据来源于我们的RDBMS关系型数据库:Sqoop数据迁移工具

    2024年02月08日
    浏览(43)
  • 大数据技术之Hadoop(八)——Flume日志采集系统

    目录 素材 一、Flume的概述 1、Flume的认识 2、Flume的运行机制 (1)Source(数据采集器) (2)Channel(缓冲通道) (3)Sink(接收器) 3、Flume的日志采集系统结构 (1)简单结构 (2)复杂结构 二、Flume的基本使用 1、系统要求 2、Flume安装 (1)下载Flume (2)解压 (3)重命名 (4)配置

    2024年02月09日
    浏览(45)
  • 日志采集传输框架之 Flume,将监听端口数据发送至Kafka

    1、简介                 Flume 是 Cloudera 提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传 输的系统。Flume 基于流式架构,主要有以下几个部分组成。  主要组件介绍: 1)、 Flume Agent 是一个 JVM 进程,它以事件的形式将数据从源头送至目的。Agent 主

    2024年01月22日
    浏览(55)
  • 【数仓】通过Flume+kafka采集日志数据存储到Hadoop

    【数仓】基本概念、知识普及、核心技术 【数仓】数据分层概念以及相关逻辑 【数仓】Hadoop软件安装及使用(集群配置) 【数仓】Hadoop集群配置常用参数说明 【数仓】zookeeper软件安装及集群配置 【数仓】kafka软件安装及集群配置 【数仓】flume软件安装及配置 【数仓】flum

    2024年03月17日
    浏览(57)
  • Hadoop集群配置问题—小记jps没有NameNode的问题

    本人Hadoop集群部署如下: hadoop102 hadoop103 hadoop104 HDFS NameNode DataNode SecondaryNameNode DataNode DataNode Yarn NodeManager ResourceManager NodeManager NodeManager   问题:当格式化NameNode后,启动hdfs。发现jps后没有显示NameNode。 解决方法:          1、先关闭各节点的运行                 在h

    2023年04月11日
    浏览(55)
  • 大数据环境搭建 Hadoop+Hive+Flume+Sqoop+Azkaban

    Hadoop:3.1.0 CentOS:7.6 JDK:1.8 这里网上教程很多,就不贴图了 【内存可以尽量大一些,不然Hive运行时内存不够】 创建tools目录,用于存放文件安装包 将Hadoop和JDK的安装包上传上去 创建server目录,存放解压后的文件 解压jdk 配置环境变量 配置免密登录 配置映射,配置ip地址和

    2024年02月09日
    浏览(39)
  • Hadoop3教程(二十六):(生产调优篇)NameNode核心参数配置与回收站的启用

    每个文件块(的元数据等)在内存中大概 占用150byte ,一台服务器128G内存的话,大概能存储9.1亿个文件块。 在Hadoop2.x里,如何配置NameNode内存? NameNode默认内存2000M。如果你的服务器内存是4G,那一般可以把NN内存设置成3G,留1G给服务器维持基本运行(如系统运行需要、Data

    2024年02月08日
    浏览(38)
  • 数仓项目6.0配置大全(hadoop/Flume/zk/kafka/mysql配置)

    我使用的root用户,懒得加sudo 所有文件夹在/opt/module 所有安装包在/opt/software 所有脚本文件在/root/bin 三台虚拟机:hadoop102-103-104 分发脚本 fenfa,放在~/bin下,chmod 777 fenfa给权限 集群规划        注意:NameNode和SecondaryNameNode不要安装在同一台服务器        注意:ResourceMan

    2024年01月18日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包