Hive内置表生成函数

1年前作者：对许分类：Toy博客阅读(10)违法举报

这篇具有很好参考价值的文章主要介绍了Hive内置表生成函数。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

1、UDF、UDAF、UDTF简介

在Hive中，所有的运算符和用户定义函数，包括用户定义的和内置的，统称为UDF（User-Defined Functions）。如下图所示：

Hive内置表生成函数,# Hive,# Hadoop生态圈,# 数据湖仓,hive,hadoop,数据仓库

UDF官方文档：https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF

其中，用户自定义聚合函数和内置聚合函数统称为UDAF（User-Defined Aggregate Functions），用户自定义表生成函数和内置表生成函数统称为UDTF（User-Defined Table-Generating Functions）

本文将主要通过具体案例详细介绍Hive的内置表生成函数（UDTF）

2、Hive内置UDTF

Hive内置UDTF官方文档：https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF#LanguageManualUDF-Built-inTable-GeneratingFunctions%28UDTF%29

2.1、explode(array/map)

功能：列转行

示例：文章来源地址https://www.toymoban.com/news/detail-753192.html

select explode(array(1,2,3))
select explode(split('1,2,3', ','))

'''
col
1
2
3
'''

select explode(map(1,2,3,4))

'''
key	value
1	2
3	4
'''

2.2、posexplode(array)

功能：列转行，第一列添加元素索引（从0开始）

示例：

select posexplode(array(1,2,3))

'''
pos	val
0	1
1	2
2	3
'''

2.3、stack(n,v1,v2,…,vk)

功能：将k个数据平均转换成n行，即k/n列，k必须是n的整数倍，空值使用NULL

示例：

-- 将9个元素按顺序分成3行3列
with user_log as (
    select stack (<

到了这里，关于Hive内置表生成函数的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

数仓知识11：Hadoop生态及Hive、HBase、Impala、HDFS之间的关系
Hive、HBase、Impala、HDFS是Hadoop生态体系中常用的开源产品，各个产品间是一个什么样的关系，许多人都搞不清楚，本文将进行研究分析。 Hadoop生态在了解Hive、HBase、Impala、和HDFS之前，先熟悉一下Hadoop的生态。 Apache Hadoop软件库是一个框架，允许使用简单的编程模型在计算机集
2023年04月08日
浏览(10)
7、hive shell客户端与属性配置、内置运算符、函数（内置运算符与自定义UDF运算符）
1、apache-hive-3.1.2简介及部署（三种部署方式-内嵌模式、本地模式和远程模式）及验证详解 2、hive相关概念详解–架构、读写文件机制、数据存储 3、hive的使用示例详解-建表、数据类型详解、内部外部表、分区表、分桶表 4、hive的使用示例详解-事务表、视图、物化视图、DDL
2024年02月09日
浏览(9)
大数据之Hadoop数据仓库Hive
Hive 是一个构建在 Hadoop 之上的数据仓库，它可以将结构化的数据文件映射成表，并提供类 SQL 查询功能，用于查询的 SQL 语句会被转化为 MapReduce 作业，然后提交到 Hadoop 上运行。特点：简单、容易上手 (提供了类似 sql 的查询语言 hql)，使得精通 sql 但是不了解 Java 编程的人也
2024年02月01日
浏览(14)
44、Flink之module模块介绍及使用示例和Flink SQL使用hive内置函数及自定义函数详细示例--网上有些说法好像是错误的
一、Flink 专栏 Flink 专栏系统介绍某一知识点，并辅以具体的示例进行说明。 1、Flink 部署系列本部分介绍Flink的部署、配置相关基础内容。 2、Flink基础系列本部分介绍Flink 的基础部分，比如术语、架构、编程模型、编程指南、基本的datastream api用法、四大基石等内容。 3、
2024年02月09日
浏览(10)
HDFS 跨集群数据同步（hive,hadoop）
两个不同的HDFS 集群数据迁移( A集群的数据 - B 集群) 采用的是 SHELL 脚本按表进行; 日期分区进行; #!/bin/bash ##################### #创建人:DZH #创建日期: 2020-04 #内容：数据迁移 ##################### ##################################### [ \\\"$#\\\" -ne 0 ] FILE=$1 path=$(cd `dirname $0`; pwd) ############## 获取执
2024年04月27日
浏览(48)
大数据技术之Hadoop学习(七)——Hive数据仓库
目录素材一、数据仓库简介 1、数据仓库的认识（1）数据仓库是面向主题的。（2）数据仓库是随时间变化的。（3）数据仓库相对稳定（4）OLTP和OLAP 2、数据仓库的结构（1）数据源（2）数据存储及管理（3）OLAP 服务器（4）前端工具 3、数据仓库的数据模型（1）星状模
2024年02月17日
浏览(28)
hive查看数据库出现org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient
在启动hive后，使用show databses查看数据库时发现，出现了这个错误根据搜索查找以及分析得知：可能是hive的数据库MySQL在安装的时候没有初始化，初始化数据库即可 schematool -dbType mysql -initSchema 1.在MySQL中删除元数据 drop database metastore; 2.进入hive中的bin里面，输入格式化命令
2024年02月07日
浏览(11)
Spark、RDD、Hive 、Hadoop-Hive 和传统关系型数据库区别
Hive Hadoop Hive 和传统关系型数据库区别 Spark 概念基于内存的分布式计算框架只负责算不负责存 spark 在离线计算功能上类似于mapreduce的作用 MapReduce的缺点运行速度慢（没有充分利用内存）接口比较简单，仅支持Map Reduce 功能比较单一只能做离线计算 Spark优势运行速度快
2024年02月13日
浏览(13)
0401hive入门-hadoop-大数据学习.md
Apache Hive是一个开源的数据仓库查询和分析工具，最初由Facebook开发，并后来捐赠给Apache软件基金会。Hive允许用户使用SQL语言来查询和分析存储在Hadoop分布式文件系统（HDFS）中的大规模数据集。它的设计目标是使非技术用户能够轻松地在Hadoop集群上执行数据查询和分析任务，
2024年02月09日
浏览(21)
大数据Hadoop之——部署hadoop+hive+Mysql环境（window11）
目录一、安装JDK8 1）JDK下载地址 2）设置环境变量二、Hadoop安装（window10环境） 1）下载Hadoop3.1.3 2）Hadoop配置环境变量 3）在hadoop解压目录下创建相关目录 4）修改Hadoop配置文件 1、core-site.xml文件：添加以下配置 2、hdfs-site.xml文件：添加以下配置，路径改成自己的安装路径 3、
2024年02月08日
浏览(25)