一、区别:
三者通常都会配合窗口函数over(),并结合partition by order by xxx来分组排序,即形式使用:function_name over(partition by xxx order by xxx)。首先三者都是产生一个自增序列,不同的是
row_number() 排序的字段值相同时序列号不会重复,如:1、2、(2)3、4、5(出现两个2,第二个2继续编号3)
rank() 排序的字段值相同时序列号会重复且下一个序列号跳过重复位,如:1、2、2、4、5(出现两个2,跳过序号3,继续编号4)
dense_rank() 排序的字段值相同时序列号会重复且下一个序列号继续序号自增,如:1、2、2、3、4(出现两个2,继续按照3编号)
二、举例介绍
有如下学生成绩表:student_score(假设只有一个学生多门课程)
统计每个学生各科成绩由高到低排序,语句如下:
SELECT
row_number() over(partition by name order by score DESC) AS row_number,
rank() over(partition by name order by score DESC) AS rank,
dense_rank() over(partition by name order by score DESC) AS dense_rank,
name,
subject,
score
FROM
统计结果如下图所示:
从上图结果可以看出区别
row_number 排序字段值相同时,序号不同,下一个序号顺序自增
rank 排序字段值相同时,序号相同,下一个序号跳跃自增文章来源:https://www.toymoban.com/news/detail-416148.html
dense_rank 排序字段值相同时,序号相同,下一个序号顺序自增文章来源地址https://www.toymoban.com/news/detail-416148.html
到了这里,关于Hive的Rank排名(rank函数,dense_rank函数,row_numer函数)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!