【hive】hive中row_number() rank() dense_rank()的用法

这篇具有很好参考价值的文章主要介绍了【hive】hive中row_number() rank() dense_rank()的用法。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

hive中row_number() rank() dense_rank()的用法

一、函数说明

主要是配合over()窗口函数来使用的，通过over(partition by order by )来反映统计值的记录。

rank() over()是跳跃排序，有两个第二名时接下来就是第四名(同样是在各个分组内)
dense_rank() over()是连续排序，有两个第二名时仍然跟着第三名。相比之下　　row_number是没有重复值的
row_number() 会根据顺序计算，仅仅是加了序号

二、应用场景

可以用于学生成绩排名

row_number()按照值排序时产生一个自增编号，不会重复(如：1、2、3、4、5、6)

rank() 按照值排序时产生一个自增编号，值相等时会重复，会产生空位(如：1、2、3、3、3、6)dense_rank() 按照值排序时产生一个自增编号，值相等时会重复，不会产生空位(如：1、2、3、3、3、4)

下面开始学习这几个函数：

准备数据：

字段名为：name、orderdate、cost

Jack,2017-01-01,10
Tony,2017-01-02,15
Jack,2017-02-03,23
Tony,2017-01-04,29
Jack,2017-01-05,46
Jack,2017-04-06,42
Tony,2017-01-07,50
Jack,2017-01-08,55
Mark,2017-04-08,62
Mart,2017-04-09,68
Meil,2017-05-10,12
Mart,2017-04-11,75
Meil,2017-06-12,80
Mart,2017-04-13,94

创建表：

create table business(
name string,
orderdate string,
cost int)
row format delimited
fields terminated by ",";

加载数据：

load data local inpath "/root/business.txt" into table business;

1、row_number() over()排序功能：

在使用 row_number() over()函数时候，over()里头的分组以及排序的执行晚于 where group by order by 的执行。

partition by 用于给结果集分组，如果没有指定那么它把整个结果集作为一个分组，它和聚合函数不同的地方在于它能够返回一个分组中的多条记录，而聚合函数一般只有一个反映统计值的记录。

例子：按月份来查询，根据cost来降序排序：

select *,row_number() over(partition by substr(orderdate,1,7) order by cost desc) as num
from business;

【hive】hive中row_number() rank() dense_rank()的用法,hive,hive,hadoop,数据仓库

2、rank() over()

rank() over()是跳跃排序，有两个第二名时接下来就是第四名(同样是在各个分组内)

为了演示效果，我们再把txt文件导入hive中，相当于hive表中有2份相同的数据

导入数据：

load data local inpath "/root/business.txt" into table business;

例子：按名字分组，并按照金额进行排序，给出编号

select *,rank() over(partition by name order by cost desc) as num from business;

【hive】hive中row_number() rank() dense_rank()的用法,hive,hive,hadoop,数据仓库

3、dense_rank() over()

dense_rank() over()是连续排序，有两个第二名时仍然跟着第三名。相比之下row_number是没有重复值的

还是上面那个例子：按名字分组，按金额降序排序，给出序号

select *,dense_rank() over(partition by name order by cost desc) as num from business;

【hive】hive中row_number() rank() dense_rank()的用法,hive,hive,hadoop,数据仓库文章来源地址https://www.toymoban.com/news/detail-650428.html

到了这里，关于【hive】hive中row_number() rank() dense_rank()的用法的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

Toy模板网

【hive】hive中row_number() rank() dense_rank()的用法

hive中row_number() rank() dense_rank()的用法

一、函数说明

二、应用场景

1、row_number() over()排序功能：

2、rank() over()

3、dense_rank() over()

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2