Hive/Spark 整库导出/导入脚本

9月前作者：　Laurence 分类：Toy博客阅读(45) 违法举报

这篇具有很好参考价值的文章主要介绍了Hive/Spark 整库导出/导入脚本。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

博主历时三年精心创作的《大数据平台架构与原型实现：数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行，点击《重磅推荐：建大数据平台太难了！给我发个工程原型吧！》了解图书详情，京东购书链接：https://item.jd.com/12677623.html，扫描左侧二维码进入京东手机购书页面。

1. 整库导出为一个SQL文件

database="<your-database-name>"

cat << EOF > $database.sql
drop database if exists $database cascade;
create database if not exists $database;
use $database;
EOF

for table in $(beeline -n hadoop -u jdbc:hive2:// --showHeader=false --outputformat=tsv2 -e "use $database; show tables;"); do 
    beeline -n hadoop -u jdbc:hive2:// --showHeader=false --outputformat=tsv2 -e "show create table $database.$table;" >> $database.sql
    echo ";" >> $database.sql
done

2. 从SQL文件导入数据库

spark-sql -f /path/to/your-exported-db.sql

文章来源地址https://www.toymoban.com/news/detail-663851.html

到了这里，关于Hive/Spark 整库导出/导入脚本的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

【Hive-基础】表数据的导出、导入（HDFS、本地）

1、语法（1） load data ：表示加载数据（2） local ：表示从本地加载数据到hive表；否则从HDFS加载数据到hive表（加local是从本地复制过去，不加local是从hdfs上剪切过去）（3） inpath ：表示加载数据的路径（4） overwrite ：表示覆盖表中已有数据，否则表示追加（overwrite会把

2024年01月21日
浏览(49)
使用DataX实现mysql与hive数据互相导入导出

DataX 是阿里巴巴开源的一个异构数据源离线同步工具，致力于实现包括关系型数据库(MySQL、Oracle 等)、HDFS、Hive、ODPS、HBase、FTP 等各种异构数据源之间稳定高效的数据同步功能。为了解决异构数据源同步问题，DataX 将复杂的网状的同步链路变成了

2024年02月08日
浏览(39)
使用DataX实现mysql与hive数据互相导入导出一、概论

DataX 是阿里巴巴开源的一个异构数据源离线同步工具，致力于实现包括关系型数据库(MySQL、Oracle 等)、HDFS、Hive、ODPS、HBase、FTP 等各种异构数据源之间稳定高效的数据同步功能。为了解决异构数据源同步问题，DataX 将复杂的网状的同步链路变成了

2024年02月14日
浏览(44)
Apache Doris (三十一）：Doris 数据导入(九）Spark Load 4- 导入Hive数据及注意事项

目录 1. Spark Load导入Hive非分区表数据 2. Spark Load 导入Hive分区表数据 3. 注意事项进入正文之前，欢迎订阅专题、对博文点赞、评论、收藏，关注IT贫道，获取高质量博客内容！

2024年02月17日
浏览(48)
大数据：hive数据库的操作语法，数据表，内部表，external外部表，数据导入导出load，insert

2022找工作是学历、能力和运气的超强结合体，遇到寒冬，大厂不招人，可能很多算法学生都得去找开发，测开测开的话，你就得学数据库，sql，oracle，尤其sql要学，当然，像很多金融企业、安全机构啥的，他们必须要用oracle数据库这oracle比sql安全，强大多了，所以你需要学

2024年02月08日
浏览(76)
hive 导入导出csv文件

1、导入将CSV文件导入到hive数据库，具体操作如下，首先在hive中创建自己的table, 并且设置以逗号分隔。然后确定tmp.hb_label_C表的分布式文件路径最后在linux命令行输入查看结果 2、导出使用beeline重定向同时使用以下方式导出数据带表头

2024年02月16日
浏览(45)
【Spark数仓项目】需求八：MySQL的DataX全量导入和增量导入Hive

【Spark数仓项目】需求八：MySQL的DataX全量导入和增量导入Hive 本需求将模拟从MySQL中向Hive数仓中导入数据，数据以时间分区。测试两种导入场景，一种是将数据全量导入，即包含所有时间分区；另一种是每天运行调度，仅导入当天时间分区中的用户数据。 mysql表建表语句：

2024年02月03日
浏览(40)
在 spark-sql / spark-shell / hive / beeline 中粘贴 sql、程序脚本时的常见错误

《大数据平台架构与原型实现：数据中台建设实战》一书由博主历时三年精心创作，现已通过知名IT图书品牌电子工业出版社博文视点出版发行，点击《重磅推荐：建大数据平台太难了！给我发个工程原型吧！》了解图书详情，京东购书链接：https://item.jd.com/12677623.html，扫描

2024年02月14日
浏览(36)
【大数据技术】Hive on spark 与Spark on hive 的区别与联系

【大数据技术】Hive on spark 与Spark on hive 的区别与联系 Hive on Spark Hive 既作为存储元数据又负责sql的解析优化，遵守HQL语法，执行引擎变成了spark，底层由spark负责RDD操作 Spark on Hive Hive只作为存储元数据，Spark负责sql的解析优化，遵守spark sql 语法，底层由spark负责RDD操作

2024年02月15日
浏览(65)
Hive基础知识（十一）：Hive的数据导出方法示例

1）将查询的结果导出到本地 2）将查询的结果格式化导出到本地（加上一个以“,”隔开数据的格式） 3）将查询的结果导出到 HDFS 上(没有 local) 基本语法：（hive -f/-e 执行语句或者脚本 file）导出的数据中有两个数据源，其中除了主信息之外，还包括记录主数据信息的元数据

2024年01月22日
浏览(40)