Linux系统三剑客之grep和正则表达式的介绍(一)

这篇具有很好参考价值的文章主要介绍了Linux系统三剑客之grep和正则表达式的介绍(一)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1.正则表达式

目录

1.正则表达式

1.什么是正则表达式 ?

2.正则表达式的使用场景

3.正则表达式字符表示

4.它们之间的区别

2.grep命令

作用:

语法:

说明:

选项:options

重点

实例

3.后面的下次再更新。 


1.什么是正则表达式 ?

一个正则表达式就是描述了一个字符串集合的方式。正则表达式的表示就是一些特殊符号的组合,而每个符号代表着一些具体的意思。符合的组合就定义了一套规则和方法,其主要作用就是从大量文本从匹配出符合条件行。

2.正则表达式的使用场景

在Linux中,正则表达式的主要使用场景就是文本处理三剑客。grep,sed,awk .除此之外,vi指令也支持正则表达式。

3.正则表达式字符表示

在正则表达式中,又可以分为基本正则表达式和扩展正则表达式 。其主要区别在于:

  • 基本正则表达式只认识元字符,其元字符主要包括:^ $ . [] * ,具体含义见下表格

  • 扩展正则表达式有添加了() {} ? + | 等符号

以下为各个元字符的含义

元字符 含义 实例
^ 匹配行首 ^abc : 匹配以abc开头的字符
$ 匹配行尾 abc$ : 匹配以abc结尾的字符
^$ 空行 表示空行的意思
. 匹配任意单个字符 .a : 匹配任意和a结合的两个字符,其中必须是在后面
* 字符* 匹配0或多个此字符 *.a : 匹配任意个一个或多个含有a的字符
.* 代表任意多个字符 就是代表任意多个字符
\ 屏蔽一个元字符的特殊含义 表示去掉有意义的元字符的含义
[] 匹配中括号内的字符 [abc] : 代表匹配a或b或c
[^abc] 匹配不包含括号内的任意字符 [^abc] : 代表对abc的取反 ,这个^abc意义不同。

扩展正则中支持的字符

字符 含义 实例
+ 重复前一个字符一次或多次 a+ : 匹配包含一个a或多个a的字符 。
重复前面一个字符0次或一次 a? :匹配包含0个或一个a字符
| 同时匹配|两边的字符 "abc\|bcd" : 匹配包含abc或bcd的字符
() 可以和()的字符分组匹配 abc (d\|e\|f)” :匹配abcd,abce,abcf字符
{} 匹配前面字符的次数
{n} abc{2}” : 至少匹配abc两次
{n,m} abc{2,5}” : 匹配abc两到五次

预定义字符类

正则表达式 描述 示例
[:alnum:] [a-zA-Z0-9]匹配任意一个字母或数字字符 [[:alnum:]]+
[:alpha:] 匹配任意一个字母字符(包括大小写字母) [[:alpha:]]
[:blank:] 空格与制表符(横向纵向) [[:blank:]]
[:digit:] 匹配任意一个数字字符 [[:digit:]]+
[:lower:] 匹配小写字母 [[:lower:]]
[:upper:] 匹配大写字母 [[:upper:]]
[:punct:] 匹配标点符号 [[:punct:]]
[:space:] 匹配一个包括换行符,回车等在内的所有空白符 [[:space:]]+
[:graph:] 匹配任何一个可以看得见的且可以打印的字符 [[:graph:]]
[:xdigit:] 任何一个十六进制数 [[:xdigit:]]+
[:cntrl:] 任何一个控制字符(ASCII字符集中的前32个字符) [[:cntrl:]]
[:print:] 任何一个可以打印的字符 [[:print:]]
4.它们之间的区别

在上面我们提到正则包括基础正则和扩展正则,但是它们有什么区别呢?在什么地方使用呢 ? 接下来我们主要说明在Linux 三剑客中的不同(grep,sed,awk)

  • grep : 在grep中,如果只是使用grep ,那只能使用原字符的正则以及预定义字符类,而若想使用扩展正则中包含的字符,就必须在grep后加参数-E 。

  • sed :若要使用而扩展正则中包含的字符,就必须在sed后加参数-r。

2.grep命令

作用
  • 用于打印匹配给定模式的行

语法:

grep [options] PATTERN [FILE...] ​ grep [options] [-e PATTERN | -f FILE] [FILE...]

说明:

grep指令用于搜索所给定的模式(PATTERN )的FILE 文件里的内容 ,如果从文件内容里找到了该模式的文件内容,grep会把匹配的该行显示出来。若不指定任何文件,或给的文件名为- , 则grep会从标准输入读取内容。

 另外,也可以使用两个变种程序 egrep 和 fgrep 。 Egrep 与 grep -E 相同。 Fgrep 与 grep -F 相同。

选项:options
说明: 以下的NUM代表的是一个数字,代表的是行数
-A NUM 或者 --after-context=NUM
除了显示符合条件的那一行之外,并显示该行之后NUM行的内容
-a 或者--text
将一个二进制文件视为一个文本文件来处理;它与--binary-files=text 选项等价。

-B NUM 或者--before-context=NUM
除了显示符合条件的那一行之外,并显示该行之前NUM行的内容。

-C NUM 或者--context=NUM
除了显示符合条件的那一行之外,并显示该行之前和之后的NUM行的内容

-b 或者--byte-offset
在输出的每行前面同时打印出当前行在输入文件中的字节偏移量。

--colour[=WHEN] 或者 --color[=WHEN]
在匹配的行中,已匹配到字符串进行着色显示。WHEN可以是never,always,或是auto。

-c 或者--count
计算符合条件的行数

-d ACTION 或者 --directories=ACTION
如果输入文件是一个目录,使用动作ACTION来处理它。
默认情况下,动作ACTION是read,意味着目录将视为普通文件那样来读。
如果动作 ACTION是skip ,将不处理而直接跳过目录。
如果动作ACTION是recurse,grep 将递归地读每一目录下的所有文件。这样做和-r选项等价。

-E 或者 --extended-regexp
将E后面的模式作为一个正则表达式来使用。

-e PATTERN 或者 --regexp=PATTERN
使用PATTERN作为查找文件内容的模式(支持正则),但是在单条命令中可使用多个-e选项

-F 或者 --fixed-strings
将模式 PATTERN 视为一个固定的字符串的列表,用新行 (newlines) 分隔,只要匹配其中之一即可。

-f FILE 或者--file=FILE
从文件 FILE 中获取模式,每行一个。空文件含有0个模式,因此不匹配任何东西。

-G 或者--basic-regexp
将模式 PATTERN 作为一个基本的正则表达式这是默认值。

-H 或者 --with-filename
为每个匹配打印文件名。

-h 或者 --no-filename
当搜索多个文件时,禁止在输出的前面加上文件名前缀。

-i 或者 --ignore-case
忽略大小写的区别

-L 或者 --files-without-match
打印在文件内容中无法找到匹配后的文件名称

-l 或者 --files-with-matches
打印出在文件内容中找到匹配后的文件名

-m NUM 或者 --max-count=NUM
在找到NUM个匹配的行之后,不再读这个文件。

-n 或者 --line-number
在输出的每行前面加上它所在的文件中它的行号。

-o 或者 --only-matching
只显示匹配的行中与 PATTERN 相匹配的部分。

--label=LABEL
将来自标准输入的匹配输出视为来自输入文件LABEL的值

--line-buffering
使用行缓冲,it can be a performance penality.

-q, --quiet, --silent
不显示任何信息。

-R, -r, --recursive
递归地读每一目录下的所有文件。这样做和 -d recurse选项等价。

--include=PATTERN
仅仅在搜索匹配 PATTERN 的文件时在目录中递归搜索。

--exclude=PATTERN
在目录中递归搜索,但是跳过匹配 PATTERN 的文件。

-s 或者 --no-messages
禁止输出关于文件不存在或不可读的错误信息。

-u 或者 --unix-byte-offsets
报告Unix风格的字节偏移量。这个开关使得grep报告字节偏移量时,将文件作为Unix
风格的文本文件看待,也就是说将CR字符去掉。这将产生与在一台Unix主机上运行grep完全相同的结果。除非同时使用-b选项,否则这个选项无效。这个选项在MS-DOS和MS-Windows之外的系统中无效。

-V 或者 --version
向标准错误输出打印 grep 的版本号。

-v 或者 invert-match
显示不包含匹配模式的所有行。

-w 或者 --word-regexp
只选择含有能组成完整的词的匹配的行。判断方法是匹配的子字符串必须是一行的开始,或者是在一个不可能

-x 或者 --line-regexp
完全匹配。

-Z, --null
文件内容全部显示,不同字体通过颜色加以标注
重点

虽然在上面我们可以看到,grep中有很多选项,但是在工作中,大多数的选项是用不到的,这里我们划一下重点。

常用参数

-E 将后面的模式作为一个正则表达式(扩展正则)
-e 支持一个命令中多个正则匹配
-i 忽略大小写
-n 在匹配的行前加入编号
-v 只显示不匹配的行
实例

使用到文件info,通过grep来进行过滤,info的文件内容如下:

Linux系统三剑客之grep和正则表达式的介绍(一),Linux操作系统,接口测试,功能测试,服务器,linux,功能测试,正则表达式

  1. 查找文件info中包含ccc的内容并打印行数

grep -n "ccc" info

Linux系统三剑客之grep和正则表达式的介绍(一),Linux操作系统,接口测试,功能测试,服务器,linux,功能测试,正则表达式

2.查找文件info中包含ggg且忽略大小写的字符并打印,

grep -i "ggg" info

Linux系统三剑客之grep和正则表达式的介绍(一),Linux操作系统,接口测试,功能测试,服务器,linux,功能测试,正则表达式

3.过滤掉含有ccc的行

grep -v "ccc" info

 Linux系统三剑客之grep和正则表达式的介绍(一),Linux操作系统,接口测试,功能测试,服务器,linux,功能测试,正则表达式

4.查找包含ddd,eee,fff的行(注意:以下匹配用到正则)

grep -E "ddd|eee|fff" info

Linux系统三剑客之grep和正则表达式的介绍(一),Linux操作系统,接口测试,功能测试,服务器,linux,功能测试,正则表达式

5.查找以c开头的行

grep ^c info

Linux系统三剑客之grep和正则表达式的介绍(一),Linux操作系统,接口测试,功能测试,服务器,linux,功能测试,正则表达式

6.查找以ccx开头且结尾的行

grep ^ccx$ info

Linux系统三剑客之grep和正则表达式的介绍(一),Linux操作系统,接口测试,功能测试,服务器,linux,功能测试,正则表达式

7.查找d字符前可以是任意字符的行

grep .d info

Linux系统三剑客之grep和正则表达式的介绍(一),Linux操作系统,接口测试,功能测试,服务器,linux,功能测试,正则表达式

8.查找包含一个或多个d字符的行

grep -E d{1} info

Linux系统三剑客之grep和正则表达式的介绍(一),Linux操作系统,接口测试,功能测试,服务器,linux,功能测试,正则表达式

9.显示包含a,b,c的字符的行 ; 显示不包含a,b,c字符的行

包含:grep -i ^[abc] info
不包含: grep -i [^abc] info (是全部字符不包含a或b或c)

Linux系统三剑客之grep和正则表达式的介绍(一),Linux操作系统,接口测试,功能测试,服务器,linux,功能测试,正则表达式

10.显示包含一个或多个含有a字符的行

grep -E a+ info

Linux系统三剑客之grep和正则表达式的介绍(一),Linux操作系统,接口测试,功能测试,服务器,linux,功能测试,正则表达式

11.查找以cc开头且包含c,x,ld字符的行

grep -E "cc(c|x|ld)" info

Linux系统三剑客之grep和正则表达式的介绍(一),Linux操作系统,接口测试,功能测试,服务器,linux,功能测试,正则表达式

12.查找文件中所有的大写字符

grep [[:upper:]] info

Linux系统三剑客之grep和正则表达式的介绍(一),Linux操作系统,接口测试,功能测试,服务器,linux,功能测试,正则表达式

13.匹配任意一个字母和数字字符

grep [[:alnum:]] info

 Linux系统三剑客之grep和正则表达式的介绍(一),Linux操作系统,接口测试,功能测试,服务器,linux,功能测试,正则表达式文章来源地址https://www.toymoban.com/news/detail-801490.html

到了这里,关于Linux系统三剑客之grep和正则表达式的介绍(一)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 正则表达式和文本三剑客题型练习

    ​ 1、显示/etc/passwd文件中以bash结尾的行; 解释:使用 grep 工具来搜索文件 /etc/passwd 中匹配模式 \\\'bash$\\\' 的行。 bash$ 是一个正则表达式,其中 $ 表示行结尾。因此, \\\'bash$\\\' 匹配以 bash 结尾的行。 运行结果: ​ 2、找出\\\"netstat  -tan”命令的结果中,以‘LISTEN’后跟0或多个空白字

    2024年02月06日
    浏览(33)
  • linux命令三剑客grep、sed、awk

    准备 grep、sed、awk号称\\\"linux三剑客\\\",使用频繁,功能强大,本文通过一个实例演示下基本用法。首先准备一个文本文件,命名为text.txt,写入文件内容: grep 首先,最简单的是grep。经常用来过滤查看日志。对于grep需要知道如下几个常用的命令选项: -n: 额外输出行号。例如过

    2024年02月05日
    浏览(58)
  • Linux文本三剑客---grep、sed、awk

    awk、grep、sed是linux操作文本的三大利器,三者的功能都是处理文本,但侧重点各不相同,其中属awk功能最强大,但也最复杂。grep更适合单纯的查找或匹配文本,sed更适合编辑匹配到的文本,awk更适合格式化文本,对文本进行较复杂格式处理。 1、grep 1.1 命令格式 1.2命令功能

    2024年02月14日
    浏览(34)
  • linux文本三剑客---grep,sed,awk

    目录 grep 什么是grep? grep实例演示 命令参数: 案例演示: sed 概念:  常用选项: 案例演示: awk 概念: awk常用命令选项: awk变量: 内置变量 自定义变量 awk的简单案例 在“a b c d”的d后面插入三个字符 统计tcp连接状态数量  统计日志中状态码非200的IP的次数 什么是grep?

    2024年02月13日
    浏览(36)
  • Linux文本三剑客(grep、sed、awk)

    目录 grep 1、什么是grep和rgrep? 2、使用grep 2.1、命令格式 2.2、命令功能 2.3、命令参数 3、实战演示 sed 1、认识sed 2、使用sed 2.1、命令格式 2.2、常用选项options 2.3、地址定界 2.4、编辑命令command 3、sed用法演示 3.1、常用选项用法演示 3.2、sed地址定界演示 3.3、编辑命令command演示

    2024年02月03日
    浏览(31)
  • Linux三剑客——Linux grep命令详解:查找文件内容

    很多时候,我们并不需要列出文件的全部内容,而是从文件中找到包含指定信息的那些行,要实现这个目的,可以使用 grep 命令。 grep 命令 作为 Linux 文本处理三剑客的一员,另外两个是 sed 和 awk ,我们会在后面的文章中作详细介绍。 grep 命令 的由来可以追溯到 UNIX 诞生的

    2024年02月11日
    浏览(36)
  • Linux 文本处理三剑客:grep、sed 和 awk

    awk、grep、sed是linux操作文本的三大利器,合称文本三剑客,也是必须掌握的linux命令之一。三者的功能都是处理文本,但侧重点各不相同,其中属awk功能最强大,但也最复杂。grep更适合单纯的查找或匹配文本,sed更适合编辑匹配到的文本,awk更适合格式化文本,对文本进行较

    2024年01月17日
    浏览(39)
  • Linux中字符处理三剑客(grep sed awk )

    在 Linux 系统中,字符处理流程可以利用三个常用的工具来完成,三剑客的具体说明如下: grep:grep 是一种强大的文本搜索工具,可以搜索文件内容中包含指定文本的行,并打印出包含该文本的行。grep 命令通常用于搜索日志文件、配置文件等。 在Linux中,\\\"grep\\\"是一种文本搜索

    2024年02月08日
    浏览(32)
  • Linux三剑客grep、sed、awk(包括练习题)

    Linux grep (global regular expression) 命令用于查找文件里符合条件的字符串或正则表达式。 基本用法与常见的正则表达式 扩展正则表达式实践 此处使用grep -E 进行实践扩展正则,egrep官网已经弃用 注意:sed和awk使用单引号,双引号有特殊解释 sed是Stream Editor(字符流编辑器)的缩写

    2024年02月11日
    浏览(28)
  • Linux:管道命令与文本处理三剑客(grep、sed、awk)

    众所周知,bash命令执行的时候会输出信息,但有时这些信息必须要经过几次处理之后才能得到我们想要的格式,此时应该如何处置?这就牵涉到 管道命令(pipe) 了。管道命令使用的是 | 这个界定符号。另外,管道命令与连续执行命令是不一样的,这点下面我们会说明。 我们先

    2023年04月18日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包