Hive和Impala的行列转换-Toy模板网

这篇具有很好参考价值的文章主要介绍了Hive和Impala的行列转换。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

Hive

explode+lateral
group by+collect_list
一、列转行 (对某列拆分，形成新列)
使用函数：lateral view explode(split(column, ‘,’)) num
eg: 如表：t_row_to_column_tmp 数据如下，对tag列进行拆分
impala 列转行,Hadoop零碎问题点,hive,数据库,hadoop

select id,tag,tag_new
  from t_row_to_column_tmp
lateral view explode(split(tag, ',')) num as tag_new
where id=212022894;

impala 列转行,Hadoop零碎问题点,hive,数据库,hadoop
二、行转列 (根据主键，对某列进行合并)
使用函数：concat_ws(‘,’,collect_set(column))
说明：collect_list 不去重，collect_set 去重。 column 的数据类型要求是 string
eg：如表：t_column_to_row ，根据id，对tag_new 进行合并
impala 列转行,Hadoop零碎问题点,hive,数据库,hadoop

select id,
         concat_ws(',',collect_set(tag_new)) as tag_col
 from t_column_to_row
group by id;

impala 列转行,Hadoop零碎问题点,hive,数据库,hadoop

select id,
         concat_ws(',',collect_list(tag_new)) as tag_col
 from t_column_to_row
group by id;

impala 列转行,Hadoop零碎问题点,hive,数据库,hadoop

Impala

Impala 不支持 hive COLLECT_SET函数的方式，使用GROUP_CONCAT函数+SPLIT_PART函数替代

## IMPALA
SELECT SCORE,SPLIT_PART(GROUP_CONCAT(NAME),',',1) FROM TEST.STUDENT GROUP BY SCORE 
## HIVE
SELECT SCORE,COLLECT_SET(NAME)[0] FROM TEST.STUDENT GROUP BY SCORE

例子：

select 
	a.zhusulvguan,group_concat(b.peopleid,',') ,group_concat(b.peopleid2,',')
from 
	table_lvguan  a  join table_people b on b.zhusulvguanId = a.zhusulvguanId 
where 
group by a.zhusulvguan

impala 列转行,Hadoop零碎问题点,hive,数据库,hadoop

select 
	a.zhusulvguan,concat(group_concat(b.peopleid,','),',',group_concat(b.peopleid2,',')) peopleidall
from 
	table_lvguan  a  join table_people b on b.zhusulvguanId = a.zhusulvguanId 
where group by a.zhusulvguan

impala 列转行,Hadoop零碎问题点,hive,数据库,hadoop 文章来源地址https://www.toymoban.com/news/detail-517485.html

总结：
①group_concat（column[,char]）函数：把同组中指定的column放到一行中[通过char连接]，并且去重（列名去重，值不去重）。
②既然是同组数据的操作，那么group_concat()就要配合group by使用。特别的，group by 分组依据并不强制要求和group_concat(column)指定的column相同（个数，字段名）。
③concat(column1,‘cahr’,column2)：column1和column2的值通过cahr连接后合并