在hive内部有许多函数,如下:
内置运算符
关系运算符
算术运算符
逻辑运算符
复杂类型函数
内置函数内置聚合函数
数学函数
收集函数
类型转换函数
日期函数
条件函数
字符函数
内置聚合函数
内置表生成函数
1.1关系运算符
- 等值比较: =
- 等值比较:<=>
- 不等值比较: <>和!=
- 小于比较: <
- 小于等于比较: <=
- 大于比较: >
- 大于等于比较: >=
- 空值判断: IS NULL
- 非空判断: IS NOT NULL
- LIKE 比较: LIKE
- JAVA 的 LIKE 操作: RLIKE
- REGEXP 操作: REGEXP
1.2算术运算符
- 加法操作: +
- 减法操作: –
- 乘法操作: *
- 除法操作: /
- 取余操作: %
- 位与操作: &
- 位或操作: |
- 位异或操作: ^
9.位取反操作: ~
1.3逻辑运算符
- 逻辑与: AND 、&&
- 逻辑或: OR 、|
- 逻辑非: NOT、!
1.4复杂类型函数
- 获取array中的元素
- 获取map中的元素
- 获取struct中的元素
2.1数学函数
- 取整函数: round(double a) 四舍五入
- 指定精度取整函数: round(double a,int d) 小数部分d位之后数字四舍五入
- 向下取整函数: floor(double a) 对给定数据进行向下舍入最接近的整数
- 向上取整函数: ceil(double a) 将参数向上舍入为最接近的整数
- 向上取整函数: ceiling(double a)
- 取随机数函数: rand
- 自然指数函数: exp(double a) 返回e的n次方
- 以 10 为底对数函数: log10
- 以 2 为底对数函数: log2
- 对数函数: log(double base,double a) 返回给定底数及指数返回自然对数
- 幂运算函数: pow(double a,double p) 返回某数的乘幂
- 幂运算函数: power(double a,double p)
- 开平方函数: sqrt 返回数值的平方根
- 二进制函数: bin
- 十六进制函数: hex
- 反转十六进制函数: unhex
- 进制转换函数: conv
- 绝对值函数: abs
- 正取余函数: pmod(int a,int b)
- 正弦函数: sin
- 反正弦函数: asin
- 余弦函数: cos
- 反余弦函数: acos
- positive 函数: positive(int a) 返回a的值
- negative 函数: negative(int a) 返回a的相反数
2.2收集函数
array/map类型大小: size 返回array/map类型的元素数量
2.3类型转换函数
基础类型之间强制转换:cast(field/expr as )
2.4日期函数
- UNIX 时间戳转日期函数: from_unixtime
- 获取当前 UNIX 时间戳函数: unix_timestamp
- 日期转 UNIX 时间戳函数: unix_timestamp
- 指定格式日期转 UNIX 时间戳函数: unix_timestamp
- 日期时间转日期函数: to_date
- 日期转年函数: year
- 日期转月函数: month
- 日期转天函数: day
- 日期转小时函数: hour
- 日期转分钟函数: minute
- 日期转秒函数: second
- 日期转周函数: weekofyear
- 日期比较函数: datediff
- 日期增加函数: date_add
- 日期减少函数: date_sub
- 日期查看函数: date_format
17 日期函数:last_day 返回当前月最后一天日期
2.5条件函数
- if 函数: if(boolean condition,true_value,false_value)
- 非空查找函数: coalesce(v1,v2,v3…) 返回一组数据中第一个不为null的值
- 条件判断函数:case when a then b else c end 当值为a时返回b,否则返回c
2.6字符函数
- 字符 ascii 码函数:ascii
- base64 字符串
- 字符串连接函数:concat(String a,String b) 连接多个字符串,合并为一个字符串
- 带分隔符字符串连接函数:concat_ws(joinstr,String a,String b) 连接多个字符串,字符串之间以指定的分隔符分开
- 小数位格式化成字符串函数:format_number
- 字符串截取函数:substr(String a,int start),substring(String a,int start)从文本字符串指定的起始位置后的字符
- 字符串查找函数:instr
- 字符串长度函数:length
- 字符串查找函数:locate
- 字符串格式化函数:printf
- 字符串转换成 map 函数:str_to_map
- base64 解码函数:unbase64(string str)
- 字符串转大写函数:upper,ucase
- 字符串转小写函数:lower,lcase
- 去空格函数:trim
- 左边去空格函数:ltrim
- 右边去空格函数:rtrim
- 正则表达式替换函数:regexp_replace(string a,string b,string c) 字符串a中的b字符被c字符替代
- 正则表达式解析函数:regexp_extract
- URL 解析函数:parse_url
- json 解析函数:get_json_object(string json_string,string path) 拆分取值
- 空格字符串函数:space 返回指定数量的空格
- 重复字符串函数:repeat(string a,int b) 重复b次a字符串
- 左补足函数:lpad
- 右补足函数:rpad
- 分割字符串函数: split
- 集合查找函数: find_in_set
- 分词函数:sentences(string a) 将字符串中内容按语句分组,每个单词间以逗号分隔,最后返回数组
- 分词后统计一起出现频次最高的 TOP-K
- 分词后统计与指定单词一起出现频次最高的 TOP-K
- 倒序字符串:reverse
- ngrams
- context_ngrams
- first_value/last_value 返回当前列第一个(最后一个)值
- lag/lead 返回当前值的前后值
3.内置聚合函数
- 个数统计函数: count
- 总和统计函数: sum
- 平均值统计函数: avg
- 最小值统计函数: min
- 最大值统计函数: max
- 返回指定列的方差: var_pop
- 返回指定列的样本方差: var_samp
- 返回指定列的偏差: stddev_pop
- 返回指定列的样本偏差: stddev_samp
- 两列数值协方差:covar_pop
- 两列数值样本协方差:covar_samp
- 返回两列数值的相关系数:corr(col1,col2)
13.中位数函数: percentile - 近似中位数函数: percentile_approx
- 直方图: histogram_numeric
- 集合去重数:collect_set
- 集合不去重函数:collect_list
4.内置表生成函数
- array/map拆分多行:explode
2.json_tuple
测试:
1.1关系运算符
关系运算符:= <=> > >= < <=
– select 5<=>5 true
– select 6>=5 true
– select 8<=7 false
like/rlike比较
– select ‘football’ like ‘foot%’ true
– select ‘2697566722@qq.com’ rlike ‘\@[0-9a-z]{2,}.(com|cn|org|edu)’ true
regexp
– select ‘football’ regexp ‘\w{9,}[a-z]’ false
1.2算术运算符
复制代码
– select 5+5 10
– select 5-5 0
– select 5*5 25
– select 5/5 1
– select 5%4 1
– select 5&9 1
– select 5|9 13
– select 5^9 12
复制代码
1.4复杂类型函数
– select array(1,4,5,6,8) [1,4,5,6,8]
– select map(‘name’,‘张三’,‘age’,18) {“name”:“张三”,“age”:“18”}
– select struct(array(1,3,5),map(‘name’,‘张三’,‘age’,18)) {“col1”:[1,3,5],“col2”:{“name”:“张三”,“age”:“18”}}
2.1数学函数
复制代码
– select round(5.3423) 5
– select round(5.345,2) 5.35
– select floor(5.9) 5
– select ceil(5.1) 6
– select rand() 0.7311469360199058
– select exp(2) 7.38905609893065
– select log(5,25) 2
– select pow(2,3) 8
– select sqrt(25) 5
– select bin(8) 1000
– select hex(16) 10
– select unhex(100)
– select abs(-10) 10
– select pmod(5,2) 1
– select sin(3.1415926/2) 0.9999999999999997
– select asin(0.9999999999999997) 1.5707963009853283
– select positive(10) 10
– select negative(10) -10
复制代码
2.2收集函数
– select size(array(1,3,4,5,6,7,8)) 7
2.4日期函数
复制代码
– select from_unixtime(0,‘yyyy-MM-dd HH:mm:ss’) 1969-12-31 19:00:00
– select unix_timestamp() 1598707426
– select to_date(‘2020-1-1’) 2020-01-01
– select year(current_date()) 2020
– select month(current_date()) 8
– select day(current_date()) 29
– select hour(current_timestamp()) 9
– select minute(current_timestamp()) 26
– select second(current_timestamp()) 15
– select weekofyear(current_date()) 35
– select datediff(current_date(),‘2020-08-01’) 28
– select date_add(current_date(),1) 2020-08-30
– select date_sub(current_date(),1) 2020-08-28
– select date_format(current_date(),‘y’) 2020
– select last_day(‘2020-01-02’) 2020-01-31
复制代码
2.5条件函数
– select if(1=3,3,2) 2
– select coalesce(null,3,null,4) 3
– select case when 5>9 then 4 else 0 end 0
2.6字符函数
复制代码
– select ascii(‘,’) 44
– select concat(‘张三’,‘吃饭’) 张三吃饭
– select concat_ws(‘-’,‘张三’,‘干嘛去了’) 张三-干嘛去了
– select format_number(2.4234432532,3) 2.423
– select substr(87654321,3,2) 65
– select instr(‘张三在哪’,‘在’) 3
– select length(‘324322’) 6
– select locate(‘吗’,‘吃了吗’) 3
– select printf(‘你好’) 你好
– select str_to_map(‘name:李四,age:18’,‘,’,‘:’) {“name”:“李四”,“age”:“18”}
– select upper(‘abc’) ABC
– select lower(‘ABC’) abc
– select trim(’ 你好 ‘) 你好
– select regexp_replace(‘早上好’,‘早’,‘晚’) 晚上好
– SELECT regexp_extract(‘100-200’, ‘(\d+)-(\d+)’, 1) FROM src LIMIT 1 100
– select parse_url(‘https://home.cnblogs.com/u/afeiiii/’,‘PROTOCOL’) https
– select id,get_json_object(line,’
.
n
a
m
e
′
)
n
a
m
e
,
g
e
t
j
s
o
n
o
b
j
e
c
t
(
l
i
n
e
,
′
.name') name,get_json_object(line,'
.name′)name,getjsonobject(line,′.age’) age,get_json_object(line,‘$.gender’) gender from jsontest
– select repeat(‘a’,4) aaaa
– select split(‘howAareByou’,‘[AB]’) [“how”,“are”,“you”]
– select find_in_set(‘aa’,‘aa,bb,aa’) 1
– select sentences(‘你,吃了吗’) [[“你”,“吃了吗”]]
复制代码
4.内置表生成函数文章来源:https://www.toymoban.com/news/detail-621889.html
–explode(a) - separates the elements of array a into multiple rows, or the elements of a map into multiple rows and columns explode适合array/map的拆分
–select id,t.name,t.age,t.gender from jsontest lateral view json_tuple(line,‘name’,‘age’,‘gender’)t as name,age,gender json_tuple适合String类型拆分文章来源地址https://www.toymoban.com/news/detail-621889.html
到了这里,关于hive函数大全的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!