1,时间函数
2,聚合函数
注意:聚合函数常与 SELECT 语句的 GROUP BY 子句一块儿使用。换句话说使用聚合函数时,一个列字段要不在group by里,要没必要须在聚合函数里面,不能单独出现,不然报错。
3,字符串函数
4,连接函数
5,其他函数
6,窗口函数
1,lead(col,n,m) over(partition by … order by …):
其中col是要取的字段,n是取排序后的第几条记录;m是缺省值,如果后面的记录取不到值就去m,m的数据类型要和col一致,不然会报错,m可不填值,默认为空
2,lag() over(partition by … order by …)
与lead() over(partition by … order by …)相似,只是去上一条记录的某字段;
3,ROW_NUMBER()
为每一组的行按顺序生成一个连续序号。
4,RANK()
也为每一组的行生成一个序号,与ROW_NUMBER()不同的是如果按照ORDER BY的排序,如果有相同的值会生成相同的序号,并且接下来的序号是不连序的。例如两个相同的行生成序号2,那么接下来会生成序号4
5,DENSE_RANK()
和RANK()类似,不同的是如果有相同的序号,那么接下来的序号不会间断。也就是说如果两个相同的行生成序号2,那么接下来生成的序号还是3。
注意:3,4,5都属于排名开窗函数,ORDER BY 指定排名开窗函数的顺序,在排名开窗函数中必须使用ORDER BY语句。
6,Hive-sql特点和sql的区别
1、Hive不支持等值连接
不支持等值连接,一般使用left join、right join 或者inner join替代。
SQL中内关联可以这样写: select * from a , b where a.key = b.key
Hive中应该这样写: select * from a join b on a.key = b.key
hive中不能使用省去join的写法。
2、分号字符
分号是sql语句的结束符号,在hive中也是,但是hive对分号的识别没有那么智能,有时需要进行转义 “;” --> “\073”
3、NULL
sql中null代表空值,但是在Hive中,String类型的字段若是空(empty)字符串,即长度为0,那么对它 is null 判断结果为False
4、Hive不支持将数据插入现有的表或分区中
Hive仅支持覆盖重写整个表。
insert overwrite 表 (重写覆盖)
5、Hive不支持 Insert into 表 Values(), UPDATA , DELETE 操作
insert into 就是往表或者分区中追加数据。文章来源:https://www.toymoban.com/news/detail-438230.html
6、Hive支持嵌入mapreduce程序,来处理复杂的逻辑
7、Hive支持将转换后的数据直接写入不同的表,还能写入分区,hdfs和本地目录
避免多次扫描输入表的开销。文章来源地址https://www.toymoban.com/news/detail-438230.html
8、HQL不支持行级别的增、改、删,所有数据在加载时就已经确定,不可更改。
9,HiveSQL不支持事务,支持分区存储,HiveSQL落地到hdfs
收藏加关注,再来不迷路!!!
到了这里,关于hiveSQL常见函数及用法(持续收集)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!