spark获取hadoop服务token

10月前作者：zincooo 分类：Toy博客阅读(32) 违法举报

这篇具有很好参考价值的文章主要介绍了spark获取hadoop服务token。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

问题现象

通过yarn-cluster模式提交spark作业，客户端日志一直卡在submit app，没有运行

问题排查

1.查看yarn app日志

appid已生成，通过yarn查看app状态为等待am运行。具体查看am日志发现其一直在尝试访问hbase，尝试了36次后失败(集群hbase服务已正常停止)
spark获取hadoop服务token,线上问题,spark,hadoop,大数据

问题：作业逻辑中不含hbase的相关内容，为什么会去访问hbase？

2.问题分析与原因

分析：
通过上面截图的堆栈信息查看从obtainDeletionTokens方法到HBaseDelegationTokenProvider的obtainDeletionTokens方法，说明这里是去尝试获取hbase的安全令牌。
(hbase的token获取的用户需要具有hbase:meta表的exec权限)

原因：
spark 官方文档文章来源地址https://www.toymoban.com/news/detail-742533.html

在官网的文档描述：kerberos环境中，spark app在认证的时候，可能会获取hdfs、hive、hbase等服务的安全令牌。
获取hbase的条件：hbase位于集群classpath，同时集群hbase开启了kerberos认证。
所以我们想跳过这个过程，需要提交作业时传入spark.yarn.security.credentials.hbase.enabled=false

到了这里，关于spark获取hadoop服务token的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Java线上服务CPU、内存飙升问题排查步骤！

作为一名从事Java开发快一年的程序员，在线上经常碰到某个模块的Pod发出CPU与内存告警的问题，而这些问题会导致系统响应缓慢甚至是服务不可用。一般情况下可以通过重启或者调高Pod的资源量或者增加Pod数量暂时解决问题，但这是治标不治本的，只有找到问题发生的原

2024年02月16日
浏览(49)
服务攻防-数据库安全-服务应用的安全问题以及测试流程-Mysql&Hadoop&未授权访问&RCE-漏洞复现

目录一、服务应用的安全问题 1、配置不当——未授权访问 2、安全机制——特定安全漏洞 3、安全机制——弱口令爆破攻击二、服务应用的安全测试思路 1、判断服务是否开放 2、判断服务类型 3、判断利用方式三、Mysql-未授权访问-CVE-2012-2122 利用 1、漏洞概述 2、漏洞复现

2024年02月17日
浏览(47)
【笔记】Python3｜爬虫请求 CSRF-Token 时如何获取Token、Token过期、处理 CSRF-Token 需要注意的问题及示例

CSRF-Token 机制是 Web 应用程序中常用的安全机制，它可以防止跨站请求伪造攻击，但会给爬虫造成一定的困扰。本文将介绍在使用 Python3 爬虫时，处理 CSRF-Token 机制需要注意的问题及示例。在 Web 开发中，每次发送请求时，服务器都会生成一个 CSRF-Token。当用户访问

2024年02月04日
浏览(105)
【大数据技术Hadoop+Spark】Spark架构、原理、优势、生态系统等讲解（图文解释）

Spark最初由美国加州伯克利大学（UCBerkeley）的AMP（Algorithms， Machines and People）实验室于2009年开发，是基于内存计算的大数据并行计算框架，可用于构建大型的、低延迟的数据分析应用程序。Spark在诞生之初属于研究性项目，其诸多核心理念均源自学术研究论文。2013年，Spark加

2024年01月16日
浏览(51)
线上 udp 客户端请求服务端客户端句柄泄漏问题

本题分别从如下三个方面来分享：问题描述自定义连接池的编写 common_pool 的使用线上有一个业务，某个通服务通知 udp 客户端通过向 udp 服务端（某个硬件设备）发送 udp 包来进行用户上线操作当同时有大量的请求打到 udp 服务端的时候，udp 服务端的回包可能会在网络环境

2024年02月09日
浏览(66)
vue 前端登录获取token后添加到cookie，并使用token获取其他数据（添加到请求头中）

1.登录获取到token存到cookie中这里我的cookie设置为一天失效 cookie.js代码如下 main.js导入到全局使用 request.js请求头添加token 最后浏览器可查看到并且下一次发请求时候请求参数中可查看到

2024年02月15日
浏览(43)
大数据经典技术解析：Hadoop+Spark大数据分析原理与实践

作者：禅与计算机程序设计艺术大数据时代已经来临。随着互联网、移动互联网、物联网等新兴技术的出现，海量数据开始涌现。而在这些海量数据的基础上进行有效的处理，成为迫切需要解决的问题之一。Apache Hadoop和Apache Spark是目前主流开源大数据框架。由于其易于部署

2024年02月07日
浏览(43)
大数据实战（hadoop+spark+python）：淘宝电商数据分析

虚拟机：Ubuntu 20.04.6 LTS docker容器 hadoop-3.3.4 spark-3.3.2-bin-hadoop3 python，pyspark, pandas，matplotlib mysql，mysql-connector-j-8.0.32.jar（下载不需要积分什么的）淘宝用户数据以上的技术积累需要自行完成创建容器（##ubuntu的代码块，在ubuntu中运行，无特殊说明的在docker中运行）更新软件

2024年02月11日
浏览(71)
Hadoop与Spark：大数据处理框架的比较与选择

Hadoop与Spark：大数据处理框架的比较与选择在大数据的时代背景下，数据处理和分析的需求日益增长。为了满足这些需求，开发者们创造了许多大数据处理框架，其中最为人们熟知的可能就是Hadoop和Spark了。这两者各有其优势，选择哪一个取决于你的具体需求。下面我们将对

2024年01月25日
浏览(42)
大数据：Hadoop基础常识hive，hbase，MapReduce，Spark

Hadoop是根据Google三大论文为基础研发的，Google 三大论文分别是: MapReduce、 GFS和BigTable。 Hadoop的核心是两个部分：一、分布式存储（HDFS，Hadoop Distributed File System）。二、分布式计算（MapReduce）。 MapReduce MapReduce是“ 任务的分解与结果的汇总”。 Map把数据切分——分布式存放

2024年04月25日
浏览(55)