正则表达式与文本处理器

9月前作者：manyulanlanlu 分类：Toy博客阅读(47) 违法举报

这篇具有很好参考价值的文章主要介绍了正则表达式与文本处理器。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

文本处理器三剑客：grep（查找） sed awk

正则表达式：由一类特殊字符以及文本字符所编写的一种模式，处理文本当中的内容

其中的一些字符不表示字符的字面含义，这些字符表示控制或者通配的功能

通配符：匹配文件名和目录名，不能匹配文件内容

正则表达式有两种匹配结果：命令结果和文件内容都可以进行匹配

通配符：

*：匹配任意一个或多个字符例：ls *.txt

？：匹配任意一个字符例：ls ?,txt

[ ] ：匹配范围内的任意单个字符例：touch {a..z}.txt ls [a-b].txt

正则表达式：有两种形态 1、基本正则表达式 2、拓展正则表达式两者仅限于写法上的区别，其他一样

基本正则：字符匹配，元字符，匹配的部分需要用引号引起来

.：表示匹配任意的单个字符，可以是一个汉字例：ls | grep "12."

\：表示转义符 \.才是表示一个点

()：表示分组的意思 \(\)：这时仅表示( )

[ ]：匹配已指定范围内的任意单个字符

例：[0-9] [A-Z] [a-z] ls | grep "[0-9]" 显示所有：ls | grep "[0-9 a-z A-Z]" 标准写法

[ ^ ]：表示取反，指定范围外的

例：ls | grep "[A-Z0-9.]" .也算字符

例：以rc开头，任意单个字符，0-6的数字

正则表达式与文本处理器,正则表达式,linux,运维

只匹配以rc.为开头的文件

正则表达式与文本处理器,正则表达式,linux,运维

过滤/etc/passwd中任意的两个字符r和t

正则表达式与文本处理器,正则表达式,linux,运维

文章来源地址https://www.toymoban.com/news/detail-599586.html

总结：通配符不能完全匹配大小写，真正的大小写在正则表达式中

表示匹配不是a或者z的任意字符

正则表达式中表示次数的表达式：

*：匹配前面的字符任意次，0次也行，无数次也行，有多少匹配多少，没有也行

正则表达式与文本处理器,正则表达式,linux,运维

.*：也是匹配任意长度的字符，但是至少要有一次，不包括0次

正则表达式与文本处理器,正则表达式,linux,运维

最少前面要有一个o，否则不匹配

\?：表示匹配前面的字符0次或者1次（即可有可无）

正则表达式与文本处理器,正则表达式,linux,运维

有则匹配，没有也匹配

\+：匹配前面的字符至少一次，最多可以无数次

\{n\}：匹配前面的字符=n次精确匹配 n：表示前面字符出现的次数，多一次少一次都不行、、

正则表达式与文本处理器,正则表达式,linux,运维

\{m，n\}：匹配前面的字符最少m次，最多n次

正则表达式与文本处理器,正则表达式,linux,运维

\{，n\}：匹配前面的字符最多n次大于n不行 o最少出现n次

\{n，\}：匹配前面的字符至少n次小于n不行

匹配次数就是核心

位置锚定：以什么为开头，以什么为结尾

^：以什么为开头，在模式的左侧 ^r 以r为开头

$：以什么最为结尾，在模式的右侧 r$ 以r为结尾

^ root $：用于匹配整行，而且整行中只有一个root，多一个少一个都不行

^$：匹配空行

正则表达式与文本处理器,正则表达式,linux,运维

词首锚定和词尾锚定（用的较少）

词尾铆钉：<或者 \b 推荐用\b因为更直观，用\b的位置来判断词首和词尾

词首锚定：>或者 \b

例：正则表达式与文本处理器,正则表达式,linux,运维

分组：用（）进行表示

精确匹配 \{\} 一定要连续出现 \{,3\} 就不用连续出现

\{n\} 表示正好n次，n次表示前面的字符必须连续出现才能出现

\{，n\} 只要出现几次都算，除非没有

例：

正则表达式与文本处理器,正则表达式,linux,运维

正则表达式与文本处理器,正则表达式,linux,运维

只匹配gogle

正则表达式与文本处理器,正则表达式,linux,运维

\ |：表示逻辑或

正则表达式与文本处理器,正则表达式,linux,运维

扩展正则：就是把 \ 去掉不用再写，但是也有要求 grep 要写成 grep -E 或 egrep

正则表达式与文本处理器,正则表达式,linux,运维

到了这里，关于正则表达式与文本处理器的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Shell 正则表达式及综合案例及文本处理工具

目录一、常规匹配二、常用特殊字符三、匹配手机号四、案例之归档文件五、案例之定时归档文件六、Shell文本处理工具 1. cut工具 2. awk工具一串不包含特殊字符的正则表达式匹配它自己例子，比如说想要查看密码包含root字符串的，可以这样写 cat /etc/passwd | grep root 特

2024年01月17日
浏览(48)
notepad++配合正则表达式分组模式处理文本转化为sql语句

一、正则分组知识点补充正则分组和捕获 ()：用于分组和捕获子表达式。大白话就是()匹配到的数据，通过美元符号加下标可以获取该数据，例如$1、$2, 下标从1开始。下面的案例就采用该模式处理文本数据二、使用正则的需求背景有一份报表的数据，需要把数据入库到m

2024年02月07日
浏览(58)
正则表达式 (用于灵活匹配文本的表达式)

目录 . * 用于匹配任意单个字符，除了换行符。例如使用正则表达式 a.b, 它可以匹配aab、acb、a#b 用于匹配前一个字符零次或多次。例如，使用正则表达式 ab*c ，它可以匹配 \\\"ac\\\"、\\\"abc\\\"、\\\"abbc\\\"，因为 b* 表示匹配零个或多个字符 \\\"b\\\"。所以，这个表达式可以匹配 \\\"ac\\\"（零个 \\\"b\\\"），

2024年01月16日
浏览(61)
文本三剑客&正则表达式2

主要是对文件内容按照行的方式进行增删改查工作流程 sed的工作流程主要包括** 读取、执行和显示 **三个过程读取 sed从输入流 (文件、管道、标准输入) 中读取一行内容并存储到临时的缓冲区中（又称模式空间，pattern space ) 执行默认情况下，所有的sed命令都在模式空间中

2024年02月05日
浏览(46)
正则表达式和文本三剑客题型练习

1、显示/etc/passwd文件中以bash结尾的行；解释：使用 grep 工具来搜索文件 /etc/passwd 中匹配模式 \\\'bash$\\\' 的行。 bash$ 是一个正则表达式，其中 $ 表示行结尾。因此， \\\'bash$\\\' 匹配以 bash 结尾的行。运行结果： 2、找出\\\"netstat -tan”命令的结果中，以‘LISTEN’后跟0或多个空白字

2024年02月06日
浏览(43)
XPath 文本匹配：正则表达式的应用与技巧

2023年07月16日
浏览(46)
使用正则表达式替换文本中的html标签

我们存储 markdown 文章时，如果存储转换后的 html 页面，那么在查出来的时候，会带有标签，可以使用正则表达式去除标签如果要展示 html 文本，肯定不能直接删除掉标签，如下即可：

2024年02月13日
浏览(44)
【23JavaScript 正则表达式】深入解析JavaScript正则表达式：基础概念、常用方法和实例详解，轻松掌握强大的文本模式匹配工具

正则表达式是一种强大的文本模式匹配工具，用于在字符串中搜索和操作特定的文本模式。在JavaScript中，正则表达式提供了一种灵活的方式来处理字符串操作。在JavaScript中，可以通过使用字面量表示法或RegExp对象来创建正则表达式。字面量表示法 RegExp对象 JavaScript中的正则

2024年02月08日
浏览(61)
Python正则表达式提取文本中的IP地址

Python正则表达式提取文本中的IP地址在Python中，使用正则表达式可以方便地从文本中抽取符合规则的字符串。其中，IP地址是一个常见的需要抽取的内容之一。IP地址通常由四段数字组成，每段数字的取值范围是0~255。下面将演示如何在Python中使用正则表达式抽取文本中的IP地

2024年02月16日
浏览(62)
【正则表达式】获取html代码文本内所有＜script＞标签内容

一. 背景之前要对学生提交的html代码进行检查，在获取了学生提交的html代码文本后，需要使用正则去截取内部的script标签内容做进一步的检查。假设得到html文本如下（不是代码），我们要得到全部的script标签内容并提取出来。看上去不难，但是实际操作起来有一定的坑，

2024年01月17日
浏览(47)