Hive产生大量Info日志的问题(由Flink On Yarn配置引起的)

这篇具有很好参考价值的文章主要介绍了Hive产生大量Info日志的问题(由Flink On Yarn配置引起的)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1、背景

当时,hive安装部署好,并没有这个问题,后面部署了 Flink On Yarn,就没有使用过hive了。

2、问题

(1)使用 bin/hive 的时候,会打印大量的INFO日志,不停的刷日志,sql语句这些能够正常执行(MR引擎或者Tez引擎都可以),但是其实无法正常使用。

(2)info日志如下所示:
flink on yarn日志过大,日常问题解决,hive,flink,hadoop

(3)而后想通过启动 hiveserver2服务,使用DataGrip去连接操作Hive,这样至少不用看见那烦人的INFO日志了。。。事实是,sql语句无法正常跑下去。。。

3、解决办法

出现这个问题的原因:环境变量配置了HADOOP_CLASSPATH导致的。

vim /etc/profile.d/my_env.sh
把最下面的注释掉或者删掉,重启服务器,重启集群,重新连接hive。
注意,除了source加载一次,一定要重启服务器哈(reboot)!!!!!!我就是栽在了这里,坑了半天。。。

##HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop-3.1.3
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

下面这两个环境变量是在部署FLink On Yarn的时候用到的,为以后使用方便,我选择注释即可!!!
#export HADOOP_CONF_DIR=/opt/module/hadoop-3.1.3/etc/hadoop
#export HADOOP_CLASSPATH=`hadoop classpath`

4、测试Hive是否正常

flink on yarn日志过大,日常问题解决,hive,flink,hadoop
后面sql语句都正常使用。文章来源地址https://www.toymoban.com/news/detail-668485.html

到了这里,关于Hive产生大量Info日志的问题(由Flink On Yarn配置引起的)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Flink配置Yarn日志聚合、配置历史日志。

    对于已经结束的yarn应用,flink进程已经退出无法提供webui服务。所以需要通过JobHistoryServer查看保留在yarn上的日志。 下面就给大家分享一下我在配置方面的经历吧。 1.yarn配置聚合日志 编辑 :yarn-site.xml 说明 : 开启后任务执行 “完毕” 后,才会上传日志至hdfs 查询 :yarn lo

    2024年02月10日
    浏览(35)
  • Flink on yarn 加载失败plugins失效问题解决

    flink版本:1.13.6 flink 任务运行在yarn集群,plugins加载失效,导致通过扩展资源获取任务参数失效 yarn容器的jar包及插件信息,jar包是正常上传 源码定位 加载plugins入口,TaskManagerRunner.class PluginUtils.createPluginManagerFromRootFolder 源码加载扩展资源参数入口TaskManagerRunner.class ExternalResource

    2024年02月08日
    浏览(42)
  • cdh6.3.2 Flink On Yarn taskmanager任务分配倾斜问题的解决办法

    Flink On Yarn任务启动 CDH:6.3.2 Flink:1.13.2 Hadoop:3.0.0 在使用FLink on Yarn调度过程中,发现taskmanager总是分配在集中的几个节点上,集群有11个节点,但每个任务启动,只用到两三个节点,导致这几台服务器负载过高,其他节点又比较空闲。 1、yarn.scheduler.fair.assignmultiple 2、yarn.s

    2024年02月12日
    浏览(40)
  • Flink、Yarn架构,以Flink on Yarn部署原理详解

    Apache Flink是一个开源的分布式流处理框架,它可以处理实时数据流和批处理数据。Flink的架构原理是其实现的基础,架构原理可以分为以下四个部分:JobManager、TaskManager、JobGraph、Checkpoint。 JobManager JobManager是Flink集群的控制节点,负责接收用户提交的任务,将任务分配给Task

    2024年02月12日
    浏览(40)
  • [Flink] Flink On Yarn(yarn-session.sh)启动错误

    在Flink上启动 yarn-session.sh时出现 The number of requested virtual cores for application master 1 exceeds the maximum number of virtual cores 0 available in the Yarn Cluster.错误。 版本说明: Hadoop: 3.3.4 Flink:1.17.1 在Flink On Yarn上启动 yarn-session.sh 时出现如下错误: 在yarn-site.xml文件中配置了所有可能相关的参

    2024年02月13日
    浏览(43)
  • flink on yarn 远程提交

    2024年02月10日
    浏览(51)
  • flink on yarn集群部署模式

    介绍 YARN 上部署的过程是:客户端把 Flink 应用提交给 Yarn 的ResourceManager, Yarn 的 ResourceManager 会向 Yarn 的 NodeManager 申请容器。在这些容器上,Flink 会部署JobManager 和 TaskManager 的实例,从而启动集群。Flink 会根据运行在 JobManger 上的作业所需要的 Slot 数量动态分配TaskManager 资源。

    2024年01月23日
    浏览(41)
  • 说说Flink on yarn的启动流程

    核心流程 FlinkYarnSessionCli 启动的过程中首先会检查Yarn上有没有足够的资源去启动所需要的container,如果有,则 上传一些flink的jar和配置文件到HDFS ,这里主要是启动AM进程和TaskManager进程的相关依赖jar包和配置文件。 接着yarn client会首先向RM 申请一个container来作为ApplicationMas

    2024年02月10日
    浏览(39)
  • Apache Flink连载(二十):Flink On Yarn运行 - Yarn Per-Job模式(弃用)

     🏡 个人主页:IT贫道-CSDN博客  🚩 私聊博主:私聊博主加WX好友,获取更多资料哦~  🔔 博主个人B栈地址:豹哥教你学编程的个人空间-豹哥教你学编程个人主页-哔哩哔哩视频 目录 1. 任务提交命令 2. 任务提交流程

    2024年01月20日
    浏览(41)
  • flink on yarn 中的flink-conf.yaml参数

    在 Flink on YARN 中, flink-conf.yaml 是 Flink 配置文件,用于配置 Flink 应用程序在 YARN 上的运行。通过修改 flink-conf.yaml 文件中的参数,你可以调整 Flink 集群的行为和性能。以下是一些常见的在 flink-conf.yaml 中设置的参数: yarn.application.name : 指定 Flink 应用程序在 YARN 上的名称。

    2024年02月12日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包