正则表达式与文本处理器

这篇具有很好参考价值的文章主要介绍了正则表达式与文本处理器。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

文本处理器三剑客:grep(查找) sed  awk

正则表达式:由一类特殊字符以及文本字符所编写的一种模式,处理文本当中的内容

其中的一些字符不表示字符的字面含义,这些字符表示控制或者通配的功能

通配符:匹配文件名和目录名,不能匹配文件内容

正则表达式有两种匹配结果:命令结果和文件内容都可以进行匹配

通配符:

*:匹配任意一个或多个字符              例:ls  *.txt

?:匹配任意一个字符                      例:ls  ?,txt

[ ] :匹配范围内的任意单个字符        例:touch  {a..z}.txt     ls  [a-b].txt

正则表达式:有两种形态   1、基本正则表达式  2、拓展正则表达式  两者仅限于写法上的区别,其他一样

基本正则:字符匹配,元字符,匹配的部分需要用引号引起来

.:表示匹配任意的单个字符,可以是一个汉字   例:ls  |  grep  "12."

\:表示转义符   \.才是表示一个点

():表示分组的意思    \(\):这时仅表示( )

[ ]:匹配已指定范围内的任意单个字符     

例:[0-9]  [A-Z]  [a-z]               ls  |  grep  "[0-9]"    显示所有:ls  |  grep  "[0-9  a-z  A-Z]"   标准写法

[ ^ ]:表示取反,指定范围外的    

例:ls  |  grep  "[A-Z0-9.]"     .也算字符

例:以rc开头,任意单个字符,0-6的数字

正则表达式与文本处理器,正则表达式,linux,运维

 只匹配以rc.为开头的文件

正则表达式与文本处理器,正则表达式,linux,运维

 过滤/etc/passwd中任意的两个字符r和t

正则表达式与文本处理器,正则表达式,linux,运维

 文章来源地址https://www.toymoban.com/news/detail-599586.html

总结:通配符不能完全匹配大小写,真正的大小写在正则表达式中

表示匹配不是a或者z的任意字符

正则表达式中表示次数的表达式:

*:匹配前面的字符任意次,0次也行,无数次也行,有多少匹配多少,没有也行

正则表达式与文本处理器,正则表达式,linux,运维

 .*:也是匹配任意长度的字符,但是至少要有一次,不包括0次

正则表达式与文本处理器,正则表达式,linux,运维

最少前面要有一个o,否则不匹配

 \?:表示匹配前面的字符0次或者1次(即可有可无)

正则表达式与文本处理器,正则表达式,linux,运维

 有则匹配,没有也匹配

\+:匹配前面的字符至少一次,最多可以无数次

\{n\}:匹配前面的字符=n次   精确匹配  n:表示前面字符出现的次数,多一次少一次都不行、、

正则表达式与文本处理器,正则表达式,linux,运维

 

\{m,n\}:匹配前面的字符最少m次,最多n次

正则表达式与文本处理器,正则表达式,linux,运维

 

\{,n\}:匹配前面的字符最多n次     大于n不行    o最少出现n次

\{n,\}:匹配前面的字符至少n次     小于n不行

匹配次数就是核心

位置锚定:以什么为开头,以什么为结尾

^:以什么为开头,在模式的左侧   ^r  以r为开头

$:以什么最为结尾,在模式的右侧    r$  以r为结尾

^  root  $:用于匹配整行,而且整行中只有一个root,多一个少一个都不行

^$:匹配空行   

正则表达式与文本处理器,正则表达式,linux,运维正则表达式与文本处理器,正则表达式,linux,运维

 

词首锚定和词尾锚定(用的较少)

词尾铆钉:<或者 \b  推荐用\b因为更直观,用\b的位置来判断词首和词尾

词首锚定:>或者 \b  

 例:正则表达式与文本处理器,正则表达式,linux,运维

 

分组:用()进行表示   

精确匹配 \{\} 一定要连续出现     \{,3\} 就不用连续出现

\{n\} 表示正好n次,n次表示前面的字符必须连续出现才能出现

\{,n\} 只要出现几次都算,除非没有

例:

正则表达式与文本处理器,正则表达式,linux,运维

 正则表达式与文本处理器,正则表达式,linux,运维

 

只匹配gogle 

正则表达式与文本处理器,正则表达式,linux,运维

\ |:表示逻辑或

正则表达式与文本处理器,正则表达式,linux,运维

 

扩展正则:就是把去掉不用再写,但是也有要求 grep  要写成  grep  -E  或 egrep

正则表达式与文本处理器,正则表达式,linux,运维

 

到了这里,关于正则表达式与文本处理器的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Shell 正则表达式及综合案例及文本处理工具

     目录 一、常规匹配 二、常用特殊字符 三、匹配手机号 四、案例之归档文件 五、案例之定时归档文件 六、Shell文本处理工具 1. cut工具 2. awk工具 一串不包含特殊字符的正则表达式匹配它自己 例子,比如说想要查看密码包含root字符串的,可以这样写 cat /etc/passwd | grep root 特

    2024年01月17日
    浏览(48)
  • notepad++配合正则表达式分组模式处理文本转化为sql语句

    一、正则分组知识点补充 正则分组和捕获 ():用于分组和捕获子表达式。 大白话就是()匹配到的数据,通过美元符号加下标可以获取该数据,例如$1、$2, 下标从1开始。 下面的案例就采用该模式处理文本数据 二、使用正则的需求背景 有一份报表的数据,需要把数据入库到m

    2024年02月07日
    浏览(57)
  • 正则表达式 (用于灵活匹配文本的表达式)

    目录 . * 用于匹配任意单个字符,除了换行符。 例如使用正则表达式 a.b, 它可以匹配aab、acb、a#b 用于匹配前一个字符零次或多次。 例如,使用正则表达式 ab*c ,它可以匹配 \\\"ac\\\"、\\\"abc\\\"、\\\"abbc\\\",因为 b* 表示匹配零个或多个字符 \\\"b\\\"。所以,这个表达式可以匹配 \\\"ac\\\"(零个 \\\"b\\\"),

    2024年01月16日
    浏览(61)
  • 文本三剑客&正则表达式2

    主要是对文件内容按照行的方式进行增删改查 工作流程 sed的工作流程主要包括** 读取、执行和显示 **三个过程 读取 sed从 输入流 (文件、管道、标准输入) 中读取一行内容并存储到临时的缓冲区中(又称模式空间,pattern space ) 执行 默认情况下,所有的sed命令都在模式空间中

    2024年02月05日
    浏览(45)
  • 正则表达式和文本三剑客题型练习

    ​ 1、显示/etc/passwd文件中以bash结尾的行; 解释:使用 grep 工具来搜索文件 /etc/passwd 中匹配模式 \\\'bash$\\\' 的行。 bash$ 是一个正则表达式,其中 $ 表示行结尾。因此, \\\'bash$\\\' 匹配以 bash 结尾的行。 运行结果: ​ 2、找出\\\"netstat  -tan”命令的结果中,以‘LISTEN’后跟0或多个空白字

    2024年02月06日
    浏览(43)
  • 使用正则表达式替换文本中的html标签

    我们存储 markdown 文章时,如果存储转换后的 html 页面,那么在查出来的时候,会带有标签,可以使用正则表达式去除标签 如果要展示 html 文本,肯定不能直接删除掉标签,如下即可:

    2024年02月13日
    浏览(44)
  • 【23JavaScript 正则表达式】深入解析JavaScript正则表达式:基础概念、常用方法和实例详解,轻松掌握强大的文本模式匹配工具

    正则表达式是一种强大的文本模式匹配工具,用于在字符串中搜索和操作特定的文本模式。在JavaScript中,正则表达式提供了一种灵活的方式来处理字符串操作。 在JavaScript中,可以通过使用字面量表示法或RegExp对象来创建正则表达式。 字面量表示法 RegExp对象 JavaScript中的正则

    2024年02月08日
    浏览(61)
  • Python正则表达式提取文本中的IP地址

    Python正则表达式提取文本中的IP地址 在Python中,使用正则表达式可以方便地从文本中抽取符合规则的字符串。其中,IP地址是一个常见的需要抽取的内容之一。IP地址通常由四段数字组成,每段数字的取值范围是0~255。下面将演示如何在Python中使用正则表达式抽取文本中的IP地

    2024年02月16日
    浏览(60)
  • 【正则表达式】获取html代码文本内所有<script>标签内容

    一. 背景 之前要对学生提交的html代码进行检查,在获取了学生提交的html代码文本后,需要使用正则去截取内部的script标签内容做进一步的检查。 假设得到html文本如下(不是代码),我们要得到全部的script标签内容并提取出来。 看上去不难,但是实际操作起来有一定的坑,

    2024年01月17日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包