HIVE SQL中替换不可见字符的正则表达式

这篇具有很好参考价值的文章主要介绍了HIVE SQL中替换不可见字符的正则表达式。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一.替换字符串中的空白字符

对于剔除字符串首尾的空格,使用较多的是trim()ltrim()rtrim()函数,但是他们无法去除字符串中间的空格。
这个时候通常会使用正则表达式来替换字符串中的空白字符\s表示匹配任何空白字符,包括空格、制表符、换页符等等, 等价于[ \f\n\r\t\v]。

select regexp_replace('  abcd  ef  g ','\\s+','');

返回结果:
‘abcdefg’

二.替换字符串中的无法解析的非法字符

在实际清洗过程中,发现即使使用了'\\s+'正则进行替换后,仍旧出现字符串中存在不可见字符的情况。这往往是因为上有数据在解析过程中未将无法解析的非法字符剔除掉。
这个时候可以使用regexp_replace(col_name,'[\\x00-\\x08\\x0B-\\x0C\\x0E-\\x1F]+|\\s+','')进一步对不可见字符进行处理。文章来源地址https://www.toymoban.com/news/detail-578974.html

到了这里,关于HIVE SQL中替换不可见字符的正则表达式的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 使用正则表达式替换文本中的html标签

    我们存储 markdown 文章时,如果存储转换后的 html 页面,那么在查出来的时候,会带有标签,可以使用正则表达式去除标签 如果要展示 html 文本,肯定不能直接删除掉标签,如下即可:

    2024年02月13日
    浏览(44)
  • java正则表达式匹配替换大括号变量${}和替换${}变量的值

    java正则表达式替换“$ {}”特殊字符并还原,以及java正则表达式替换${}变量为变量的值这两种操作的代码示例。 正则表达式还是非常有用的, 可以耐心看下定义,多尝试下。 正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将

    2024年02月02日
    浏览(59)
  • sed中使用正则表达式进行替换以及注意事项

    sed中使用正则表达式进行替换的时候,一定要注意,有些特殊字符在使用时要转义,目前发现的有: 用于分组的小括号:(),在使用时要用进行转义,但是匹配字符串中真正的小括号时,无需转义; 表示前面的表达式出现次数的{},也要转义; 表示前面的表达式出现1次或多

    2023年04月22日
    浏览(44)
  • 【SQL-正则】利用正则表达式进行过滤操作(常用正则表达式)

    1、由数字、26个英文字母或者下划线组成的字符串 2、非负整数(正整数 + 0 ) 3、正整数 4、非正整数(负整数 + 0) 5、负整数 6、整数 7、非负浮点数(正浮点数 + 0) 8、正浮点数 9、非正浮点数(负浮点数 + 0) 10、负浮点数 11、浮点数 12、由26个英文字母组成的字符串 13、

    2024年02月12日
    浏览(79)
  • 正则表达式替换工具V1.1.0.16绿色免费版

    字符描述: ^符号匹配字符串的开头。例如: ^abc与“abc xyz”匹配,而不与“xyz abc”匹配 $符号匹配字符串的结尾。例如: abc$与“xyz abc”匹配,而不与“abc xyz”匹配。 注意:如果同时使用^符号和$符号,将进行精确匹配。例如: ^abc$只与“abc”匹配 *符号匹配0个或多个前面

    2024年02月09日
    浏览(45)
  • 正则表达式系列|(以xx开头xx结尾提取、切分、替换)

    章节 第一章链接: 正则表达式系列|(以xx开头xx结尾提取切分) 正则表达式是对字符串操作的一种逻辑公式;作用:检索、替换那些符合某个模式(规则)的文本,可以通过一些设定的规则来匹配一些字符串,是一个强大的字符串匹配工具。 结果 结果 matcher.group(1)表示获取第一

    2024年02月14日
    浏览(39)
  • PyCharm 快捷键(Ctrl + R)正则表达式批量替换

    目录 一、使用快捷键Ctrl+R,打开替换界面 二、输入替换格式 三、点击全部替换 一、使用快捷键Ctrl+R,打开替换界面 二、输入替换格式 在第一个框输入 第二个框输入 三、点击全部替换

    2024年01月23日
    浏览(53)
  • hive中使用正则表达式匹配数字

    2024年02月14日
    浏览(49)
  • 正则表达式(常用字符简单版)

    量词 字符类 边界匹配 分组和捕获 特殊字符 字符匹配 普通字符:普通字符按照字面意义进行匹配,例如匹配字母 \\\"a\\\" 将匹配到文本中的 \\\"a\\\" 字符。 元字符:元字符具有特殊的含义,例如  d  匹配任意数字字符, w  匹配任意字母数字字符, .  匹配任意字符(除了换行符)

    2024年02月10日
    浏览(44)
  • 【编译原理】【词法分析】【正则表达式】【NFA】【DFA】【C++】正则表达式转DFA&NFA,判断字符串是否符合正则表达式的匹配算法

    显然,正则表达式、NFA、DFA的概念都很简单,所以直接上代码,注释应该解释地比较清楚, 没有万能头文件的自行替换需求库 ,如果有疑问的可以留言。 网盘链接 [自行补全]/s/1pbGT_wpB662TwFrnukXgGQ?pwd=TSIT 提取码:TSIT 原理可以参考这篇博客 传送门 本次程序由四个文件组成 文

    2024年02月11日
    浏览(84)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包