Hive（19）：DML之Insert插入数据

9月前作者：不死鸟.亚历山大.狼崽子分类：Toy博客阅读(65) 违法举报

这篇具有很好参考价值的文章主要介绍了Hive（19）：DML之Insert插入数据。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

1 背景：RDBMS中insert使用（insert+values）

在MySQL这样的RDBMS中，通常是insert+values的方式来向表插入数据，并且速度很快。这也是RDBMS中插入数据的核心方式。

INSERT INTO table_name ( field1, field2,...fieldN )
VALUES
( value1, value2,...valueN );

假如说对Hive的定位不清，把Hive当成RDBMS来使用，也使用insert+values的方式插入数据，会如何呢？

--hive中insert+values
create table t_test_insert(id int,name string,age int);
insert into table t_test_insert values(1,"allen",18);

你会发现执行过程非常非常慢，底层是使用MapReduce把数据写入HDFS的。

Hive（19）：DML之Insert插入数据,hive,hive,hadoop,数据仓库

试想一下，如何在Hive中这样玩，对于大数据分析，海量数据一条条插入是不是非常刺激。因此在Hive中我们通过将数据清洗成为结构化文件，再Load加载到表中。

但是并不意味着insert语法在Hive中没有使用地位了，通常在Hive中我们使用insert+select语句。即插入表的数据来自于后续select查询语句返回的结果。文章来源地址https://www.toymoban.com/news/detail-548530.html

到了这里，关于Hive（19）：DML之Insert插入数据的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

在hive插入数据时出现“Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask”报错

这个错误代码表明 Hive 作业由于某种原因失败。 1.资源问题：这个错误可能发生在集群上存在资源约束的情况下，例如内存或 CPU 资源不足以完成 Hive 作业。 2.数据问题：它可能与数据本身相关。例如，数据可能损坏，或者数据格式或模式存在问题，Hive 无法处理。

2024年02月05日
浏览(40)
hive插入数据后报错 FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

hive 插入数据的时候，不能直接运行，报错错误原因： namenode内存空间不够，JVM剩余内存空间不够新job运行所致错误提示: Starting Job = job_1594085668614_0006, Tracking URL = http://kudu:8088/proxy/application_1594085668614_0006/ Kill Command = /root/soft/hadoop-3.2.1/bin/mapred job -kill job_1594085668614_0006 Hadoop

2023年04月15日
浏览(36)
【大数据之Hive】十、Hive之DML（Data Manipulation Language）数据操作语言

将文件导入Hive表中。语法：说明：（1）local：表示从本地加载数据到Hive表；否则从HDFS加载数据到HIve表。（2）overwrite：表示覆盖表中已有数据，否则表示追加。（3）partition：表示上传到指定分区，若目标是分区表则需要指定分区。如：语法：说明：（

2024年02月09日
浏览(57)
Hive（18）：DML之Load加载数据

1 背景回想一下，当在Hive中创建好表之后，默认就会在HDFS上创建一个与之对应的文件夹，默认路径是由参数hive.metastore.warehouse.dir控制，默认值是/user/hive/warehouse。要想让hive的表和结构化的数据文件产生映射，就需要把文件移到到表对应的文件夹下面，当然，可以在建表的时

2024年02月13日
浏览(68)
hive表数据更新insert overwrite/merge into

根据甲方要求，需要对大数据平台指定表(hive、impala表)的历史数据[2021-01-01至2023-03-29]指定字段进行批量更新，然后把表同步到Oracle。先更新大数据平台上的表，再把更新完成的表同步到Oracle。hive有8张表更新，其中4张大表【分区表】（数据量分别为：1038738976、260958144、2586

2024年02月08日
浏览(50)
Hive 表 DML 操作第1关：将文件中的数据导入（Load）到 Hive 表中

相关知识之前系列实训中我们接触过导入本地文件到 Hive 表中，本关就进行导入的详细讲解。为了完成本关任务，你需要掌握：1.导入命令语法，2.如何将本地 txt 文件导入到分区表中。导入命令语法 Load 操作执行 copy/move 命令把数据文件 copy/move 到 Hive 表位于 HDFS 上的目录位

2024年02月01日
浏览(43)
Hive（21）：DML之Update、Delete更新、删除数据

首先，必须明确，你理解的Hive这款软件，定位是什么？是面向事务支持事务的RDBMS?还是面向分析，支持分析的数据仓库。这很重要。 Hive是基于Hadoop的数据仓库，面向分析支持分析工具。因此在Hive中常见的操作的就是分析查询select操作。将已有的结构化数据文件映射成为表，

2024年02月15日
浏览(51)
Hive数据加载方式（load、insert；普通表、分区表）

介绍 Hive 数据加载方式（insert、load) 基础语法： load data [local] inpath \\\'/opt/module/datas/student.txt\\\' [overwrite] into table student[partition ] 参数说明： 1 load data: 表示加载数据 2 local: 表示从本地加载数据到 hive 表；否则从 HDFS 加载数据到 hive 表 3 inpath: 表示加载数据的路径相对路径，例如

2024年02月03日
浏览(55)
Hive——DML（Data Manipulation Language）数据操作语句用法详解

Load语句可将文件导入到Hive表中。说明： local ：表示从本地加载数据到Hive表；否则从HDFS加载数据到Hive表。 overwrite ：表示覆盖表中已有数据，否则表示追加。 partition ：表示上传到指定分区，若目标是分区表，需指定分区。本地文件路径：执行load语句： load da

2024年04月28日
浏览(37)
大数据开发之Hive(基本概念、安装、数据类型、DDL数据定义、DML数据操作)

1.1.1 Hive产生背景 HDFS来存储海量的数据、MapReduce来对海量数据进行分布式并行计算、Yarn来实现资源管理和作业调度。但是面对海量的数据和负责的业务逻辑，开发人员要编写MR对数据进行统计分析难度极大，所以就产生了Hive这个数仓工具。Hive可以帮助开发人员将SQL语句转化

2024年01月17日
浏览(43)