SparkSQL 与 Hive 如何整合?关键步骤有哪些?

这篇具有很好参考价值的文章主要介绍了SparkSQL 与 Hive 如何整合?关键步骤有哪些?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

根据原理,就是Spark能够连接上Hive的MetaStore就可以了。所以:

1.MetaStore需要存在并开机

2.Spark知道MetaStore在哪里(IP端口号)

SparkSQL 和 Hive整合关键四步骤

第一步:将hive-site.xml拷贝到spark安装路径conf目录

第二步:将mysql的连接驱动包拷贝到spark的jars目录下

第三步:Hive开启MetaStore服务

第四步:测试SparkSQL整合Hive是否成功

Spark on Hive原理和配置

第一步:将hive-site.xml拷贝到spark安装路径conf目录

node1执行以下命令来拷贝hive-site.xml到所有的spark安装服务器上面去

cd /export/server/hive/conf
cp hive-site.xml /export/server/spark/conf/
scp hive-site.xml root@node2:/export/server/spark/conf/
scp hive-site.xml root@node3:/export/server/spark/conf/

第二步:将mysql的连接驱动包拷贝到spark的jars目录下

node1执行以下命令将连接驱动包拷贝到spark的jars目录下,三台机器都要进行拷贝

cd /export/server/hive/lib
cp mysql-connector-java-5.1.32.jar  /export/server/spark/jars/
scp mysql-connector-java-5.1.32.jar  root@node2:/export/server/spark/jars/
scp mysql-connector-java-5.1.32.jar  root@node3:/export/server/spark/jars/

第三步:Hive开启MetaStore服务

(1)修改 hive/conf/hive-site.xml新增如下配置

远程模式部署metastore 服务地址

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
    <property>
        <name>hive.metastore.uris</name>
        <value>thrift://node1:9083</value>
    </property>
</configuration>

(2) 后台启动 Hive MetaStore服务

nohup /export/server/hive/bin/hive --service metastore 2>&1 >> /var/log.log &

第四步:测试SparkSQL整合Hive是否成功

[方式1]Spark-SQL方式测试

cd /export/server/spark
bin/spark-sql --master local[2] --executor-memory 512m --total-executor-cores 1

执行成功后的界面:进入到spark-sql 客户端命令行界面

查看当前有哪些数据库, 并创建数据库

show databases;
create database sparkhive;

[方式2]PySpark-Shell方式启动:

bin/spark-shell --master local[3] 或bin/pyspark --master local[2]
spark.sql("show databases").show()

 文章来源地址https://www.toymoban.com/news/detail-461510.html

到了这里,关于SparkSQL 与 Hive 如何整合?关键步骤有哪些?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • SparkSQL和Hive语法差异

    SparkSQL关联条件on不支持函数 rand() 创建零时表时,Spark不支持直接赋值 null Spark无法读取字段类型为 void 的表 SparkSQL中如果表达式没有指定别名,SparkSQL会将整个表达式作为别名,如果表达式中包含特殊字符(如逗号)。则 CTAS建表 会失败 SparkSQL允许在join on条件中使用or等不等

    2024年01月16日
    浏览(40)
  • 【SparkSQL】SparkSQL的运行流程 & Spark On Hive & 分布式SQL执行引擎

    【大家好,我是爱干饭的猿,本文重点介绍、SparkSQL的运行流程、 SparkSQL的自动优化、Catalyst优化器、SparkSQL的执行流程、Spark On Hive原理配置、分布式SQL执行引擎概念、代码JDBC连接。 后续会继续分享其他重要知识点总结,如果喜欢这篇文章,点个赞👍,关注一下吧】 上一篇

    2024年02月04日
    浏览(48)
  • Windows下使用hadoop+hive+sparkSQL

    一、Java安装 1.1 下载 在官网下载java8(Java Downloads | Oracle) 1.2 配置java环境 1.右击此电脑-属性 2.点击左侧高级系统设置,在出现的窗口点击环境变量接下来的窗口会出现两个框,一个是用户变量,一个系统变量,我们直接在系统变量修改。 JAVA_HOME,变量名:JAVA_HOME 值:安装路径

    2024年02月21日
    浏览(30)
  • 数据湖Iceberg介绍和使用(集成Hive、SparkSQL、FlinkSQL)

    概述 为了解决数据存储和计算引擎之间的适配的问题,Netflix开发了Iceberg,2018年11月16日进入Apache孵化器,2020 年5月19日从孵化器毕业,成为Apache的顶级项目。 Iceberg是一个面向海量数据分析场景的 开放表格式(Table Format) 。表格式(Table Format)可以理解为 元数据以及数据文

    2024年02月10日
    浏览(43)
  • Wordhero AI智能写作工具:购买、攻略、资源 -揭秘如何根据关键词和标题生成段落

    Wordhero AI是我经过仔细对比,实际应用之后获得相应效果之后,坚持使用的AI写作工具。为了持续获得这方面的提升和反馈,我建立了两个渠道去让自己不断获得国内外同样工具使用者的反馈和建议: AI Content Hacker - AI Writing Guide 网站 AI Content Hacker - AI Writing Guide 油管频道 具体

    2024年02月11日
    浏览(90)
  • 无人机如何做到自动巡检?关键技术步骤分析

    无人机应用在电网、水利、交通、城管等巡逻巡检领域带来了巡视效率的提升。同时飞手操作的难度和门槛、野外环境的影响、巡检结果处理难度大等带来一系列的巡检问题,自动化的无人机巡检则能很好的解决这些问题,比如我们比较熟知的自动机场,它可以解决野外部署

    2024年02月07日
    浏览(46)
  • FPGA如何根据原理图进行约束------(基础详细教程)

    目录 一、约束时钟引脚(如CLK) 二、约束与按键相连引脚(如RST) 首先我们需要找到晶振,时钟大多数由晶振产生。 打开原理图,晶振一般在原理图中使用大写“X”或“Y”开头。 1、单端时钟 下图是一个单端时钟,时钟频率一般会在原理图中标明。(若没有在原理图中标出

    2024年02月02日
    浏览(34)
  • 如何建立一个成功的独立站?需要掌握哪些技能和步骤?

    独立站的定义 独立站是指自主搭建的网站,其所有权和掌控权都完全归属于站长自己。独立站通常需要购买域名和服务器空间,使用自己的技术和资源进行建设和维护,因此相对于第三方平台更为自主和灵活。独立站可以是个人博客、电商网站、社交网站等各种类型,其内容

    2024年02月19日
    浏览(42)
  • 【Git】IDEA整合Git详细步骤 — IDEA如何配置Git忽略文件

    一、IDEA整合Git 定位 Git 程序 —》IDEA配置Git程序  初始化本地库—》在idea中初始化项目,将项目纳入git管理  添加到暂存区  提交到本地库 方法一: 右键点击项目--- Git ----  Commit Directory  方法二: 点击绿色图标 √ 切换版本  创建分支  切换分支 合并分支 二、配置Git忽略文

    2023年04月10日
    浏览(47)
  • 自媒体新手如何从零开始做自媒体?有哪些步骤流程?

    自媒体已经成为了一种非常流行的个人创业方式,相比于传统的创业方式,自媒体的投入成本较低,且门槛较低。许多人都有一个梦想,希望成为一个自媒体人,成为自己的老板。但是,对于很多自媒体小白来说,他们不知道从哪里开始,该如何打磨自己的品牌,如何实现自

    2024年02月12日
    浏览(60)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包