关于hiveonSpark的错误问题

这篇具有很好参考价值的文章主要介绍了关于hiveonSpark的错误问题。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

关于Spark的配置

1.spark

1. spark-env.sh.template

mv命令改名

mv /opt/module/spark/conf/spark-env.sh.template /opt/module/spark/conf/spark-env.sh

添加内容

// 有了SPARK_DIST_CLASSPATH配置信息以后,
//Spark就可以把数据存储到Hadoop分布式文件系统HDFS中,
//也可以从HDFS中读取数据。如果没有配置上面信息,Spark就只能读写本地数据,
//无法读写HDFS数据。
export SPARK_DIST_CLASSPATH=$(hadoop classpath)

2.环境变量HOME

 sudo vim /etc/profile.d/my_env.sh
# SPARK_HOME
export SPARK_HOME=/opt/module/spark
export PATH=$PATH:$SPARK_HOME/bin
// 退出使用,让配置生效
source /etc/profile.d/my_env.sh

2.hive中创建spark配置文件

1. 在conf中创建spark-defaults.conf

vim /opt/module/hive/conf/spark-defaults.conf

添加

spark.master                               yarn
spark.eventLog.enabled                   true
spark.eventLog.dir                        hdfs://hadoop102:8020/spark-history
spark.executor.memory                    1g
spark.driver.memory					     1g

2.修改hive-site.xml

<!--Spark依赖位置(注意:端口号8020必须和namenode的端口号一致)-->
<property>
    <name>spark.yarn.jars</name>
    <value>hdfs://hadoop102:8020/spark-jars/*</value>
</property>
  
<!--Hive执行引擎-->
<property>
    <name>hive.execution.engine</name>
    <value>spark</value>
</property>

// 调大超时时间,防止等待时间过长导致连接spark失败.
<property>
        <name>hive.spark.client.connect.timeout</name>
        <value>10000</value>
</property>
<property>
        <name>hive.spark.client.server.connect.timeout</name>
        <value>9000000</value>
</property>

3.调大Hive堆内存 hive-env.sh.template

mv hive-env.sh.template hive-env.sh
// 改成1个G,如果有条件,还可以调大
export HADOOP_HEAPSIZE=1024
## 3.HDFS

1.向HDF上传Spark纯净版JAR包,避免依赖冲突

其他节点没有Spark,所以执行时也需要Spark依赖

hadoop fs -mkdir /spark-jars
hadoop fs -put /opt/module/spark/jars/* /spark-jars

2.capacity-scheduler.xml修改资源最大占比,提高资源利用率

<property>
    <name>yarn.scheduler.capacity.maximum-am-resource-percent</name>
    <value>0.8</value>
</property>

4.注意

和spark连接的spark一定要处于active状态,否则会出现无法创建spark问题文章来源地址https://www.toymoban.com/news/detail-699973.html

到了这里,关于关于hiveonSpark的错误问题的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 关于Redis-存Long取Integer类型转换错误的问题

    背景 最近遇到了两个Redis相关的问题,趁着清明假期,梳理整理。 1.存入Long类型对象,在代码中使用Long类型接收,结果报类型转换错误。 2.String对象的反序列化问题,直接在Redis服务器上新增一个key-value,而后在代码中get(key)时,报反序列化失败。 关于Long类型转换错误 Red

    2024年02月15日
    浏览(31)
  • 关于使用maven构建的项目IDEA提示:java: 错误: 不支持发行版本 5

    出现这个问题的主要原因是在maven中没有配置你所需要的jdk版本。解决方案有两种, 方案一:在IDEA中修改编译的jdk版本,需要修改多处,比较复杂,这里不赘述了。 方案二:直接在Maven中配置需要的jdk版本,然后刷新一下Maven就能解决 以上代码是java17,修改成你需要的jdk版本

    2024年02月07日
    浏览(67)
  • 关于访问后端接口报404的问题——全网最详细的404错误详解

    当我们通过前端向后端发起一个请求调用后端接口时,经常会遇到404的问题。网上关于对404问题介绍的一大堆,其实404问题的本质就两点。 在介绍404问题之前先温习一个小的知识点——项目访问路径 项目访问路径:就是定位一个项目的路径,可以理解为项目名,但是一般这

    2024年02月02日
    浏览(41)
  • 关于刷新nginx配置报nginx: [emerg] unknown directive错误的问题

    朋友在windows服务器用记事本编辑nginx配置文件后,刷新nginx配置,nginx返回以下错误: unknown directive 是未知指令的意思,后面带着未知指令的内容是\\\"锘?user\\\"。由此判断,是nginx配置文件编码不正确的原因。 事实上,windows的记事本编辑文本后,会以ASCII码编码进行保存。这与

    2024年02月21日
    浏览(44)
  • 关于Vue CLI项目 运行发生了 less-lorder错误的解决方案

    问题: 在运行vue项目的时候发生: Module not found: Error: Can\\\'t resolve \\\'less-loader\\\' 错误导致项目无法执行 如果你想要使用 less-loader 来处理 Less 样式文件,可以按照以下步骤进行安装和配置: 两步: 通过npm 或者 yarn 进行对 less-loader 然后再配置文件中进行配置 前提条件得安装 web

    2024年02月11日
    浏览(63)
  • 学习Spark遇到的问题

    1. 【报错】AttributeError: ‘SparkContext’ object has no attribute ‘setcheckpointDir’ 本人传参: 分析:SparkContext找不到setcheckpointDir方法,参数传参错误 解决:将setcheckpointDir改成setCheckpointDir,其中c字母大写。是因为两个方法的传参不同导致 updateTime:2024-01-23

    2024年01月24日
    浏览(25)
  • 关于引入maven项目后出现‘parent.relativePath’ of POM错误时的解决方法

    Springboot项目出现的依赖错误。 在Springboot项目启动时,项目报错‘parent.relativePath’ of POM问题,项目无法正常启动。    发生该问题的根本原因是因为在项目文件夹的外层包含着另一个项目,此时项目文件无法确定该文件的pom依赖是引用哪一个parent依赖导致的。推荐使用方法二

    2024年02月13日
    浏览(48)
  • 关于微软应用商店无法联网 错误代码:0x80072EFD的问题终于解决了

    关于微软应用商店无法联网 错误代码:0x80072EFD的问题,系统更新也显示错误,更新服务都是开启的,就是不能更新,折腾了两天试了百度很多方法, 一、修改dns无效; 二清理商店缓存wsreset无效,重新安装商店、重置商店都无效;三、用抓包软件Fiddler 修改无效(因为看到网

    2024年02月10日
    浏览(77)
  • 关于qiling->UC_ERR_FETCH_UNMAPPED等执行EXE时内存错误的问题

    使用wsl虚拟机,正常走了qiling配置流程后无法使用qiling对样例之外的exe进行模拟,会在执行到dll时,在dll的代码中报出内存未分配等读写错误。系统:kali、ubuntu20、ubuntu22。 使用VMware虚拟机后正常执行。 将我的配置流程顺下来后,怀疑: ①WSL虚拟机有未知相关的缺陷 ②或许

    2024年02月06日
    浏览(28)
  • 关于CICD流水线的前端项目运行错误,npm项目环境配置时出现报错:Not Found - GET https://registry.npm...

    原因应该是某些jar包缓存中没有需要改变镜像将包拉下来 npm config set registry http://registry.npm.taobao.org npm install npm run build

    2024年02月10日
    浏览(53)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包