正则表达式 —— Awk

这篇具有很好参考价值的文章主要介绍了正则表达式 —— Awk。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Awk

awk:文本三剑客之一,是功能最强大的文本工具

awk也是按行来进行操作,对行操作完之后,可以根据指定命令来对行取列

awk的分隔符,默认分隔符是空格或tab键,多个空格会压缩成一个

awk的用法

awk的格式:awk  选项  '模式或条件{操作}'  文件      在awk中操作默认就是打印

模式或条件:这么干    操作:操作结果    文件:操作的对象

例:打印第一列

awk  '{print  $1}'  test.txt

$0打印全部内容

awk  '{print  $1,$2,$3}'  test.txt      

常用选项:

-F:指定分隔符,如果是空格,不需要加

-v:变量赋值(用的少)

awk常用的内置变量:

$0:打印所有的内容

$n(n为数字):处理行的第n列

NR:处理行的行号

NF:处理当前行的字段个数                    $NF:表示最后一个字段

FS:列分隔符,指定文本的分隔符,和F作用一致  格式  FS=":"

不常用的:OFS输出文本的分隔符

RS:行分隔符,指定分隔符为回车

除了内置变量$n,其他的内置变量不用加$,不能用引号,也不能用括号,否则会被当成字符串处理

awk的打印功能:

awk  '{print}'  test.txt      打印所有,默认就是1

awk  '0{print}'  什么都不打印       

awk  '{print  NR}'  test.txt  只打印行号

awk  '{print  NR,$0}'   test.txt   既显示行号也显示内容

指定打印第三行   awk  'NR==3{print}'  test.txt

打印第二行到第四行  awk  'NR==2,NR==4{print}'   test.txt

奇偶打印:awk  'NR%2==0{print}'  test.txt   打印偶数行

awk  'NR%2==1{print}'   test.txt   打印奇数行

awk的运算功能:awk  'BEGIN{print  10+20}'   

也支持小数运算                                   3**2或3^2  求幂即次方

面试题:awk的内置函数:getline

1、如果getline左右没有重定向符号(>,<) 或者没有管道符是,awk会先读第一行,但是如果加了getline,会跳过第一行,去读第二行

例:awk  '{getline;print}'  test.txt  只打印第二行和第四行,跳过了第一行和第三行

相当于打印奇数行

2、如果两边有重定向或管道符,getline作用于定向输入文件

例:awk  '{getline  <  "test1.txt";print  >  "test2.txt"}'  test1.txt

先从test1获取test1的内容输入到test2,作用对象为test1

3、管道符

例:ls  |   awk  '{getline  ky30;print  $0,ky30;}'   

ky30为自定义变量

ls输出的结果传给ky30,打印ls命令的输出结果 

如果没有结果,打印空,不做如何操作

awk作为文本过滤进行打印

打印以root开头的    awk  '/^root/{print}'   test.txt

BEGIN模式更复杂的操作

awk  'BEGIN{..};{..};END{..}'  文件

在对文件进行操作之前,会先执行BEGIN{..}模式条件或命令操作

中间的{..}是真正的用于处理文件的命令

END{..}结束语句,一般都是打印执行结果

面试题:如何通过awk获取文件里有多少行

awk  'BEGIN{i=0};{i+1};END{print  i}'  test.txt  

意思为test.txt有多少行就打印多少次

了解即可:-v   变量赋值,指的是改变分隔符

例:把分隔符:换成@

awk  -v  FS=":"  -v  OFS="2"  '{print  $1,$3}'  /etc/passwd

awk的条件判断打印:

awk  -F:'$3>10{print}'  /etc/passwd  |  head  -n  15   把passwd第三列大于10的全打印出来

取反    awk  -F: '($4<10){print}'    /etc/passwd  |  head  -n  15 把第四列除了大于10的都打印出来

awk支持条件判断语句

awk  -F:'{if  ($3=10)  {print}}'  /etc/passwd        打印第三列等于10的内容

三元表达式:类似于JAVA   面试会问

格式:awk  '(条件表达式)?(A表达式或值):(B表达式或值)'

?相当于if       :相当于else

例:awk  -F:'{i=($3>$4)?$3:$4;{print;}'  /etc/passwd

如果满足第三列大于第四列就打印第三列,不满足就打印第四列

awk的精确筛选:>,<,=   比较数值

比较字符串:

$n~ "字符串":表示第n个字段包含某个字符串

$n!~ "字符串":表示不包含某个字符

$n== "字符串":表示第n个字符串就是某个字符

$n!= "字符串":表示不是某个字符串的选出来

$NF:表示最后一个字段

例:awk  -F:'$7~"bash" {print $1,$NF}'  /etc/passwd

打印第七个字段包含bash的第一例和最后一列

awk  -F:'$7~"nologin"  {print  $1,$3}'  /etc/passwd

第七个字段不是nologin,打印第一和第三个字段

awk  -F:'($6=="home/dn")&&($7=="/bin/bash"){print  $1,$NF}'

指定第六个字段为/home/dn  而且第七个字段是/bin/bash

&&相当于而且

awk  -F:'($3!=0)||($4>10) {print   $1}'  /etc/passwd

所有第三列不是0或者第四列大于10的结果,打印第一列

awk结合数组来进行使用

在awk中怎么来定义数组

awk  'BEGIN{a[0]=10;a[1]=20;a[2]=30;for(i  in  a)print  i , a[i]}'  

取的是a的索引        i  in的是a的索引    0,1,2是a的索引

去重统计

awk  '{a[$1]++};END{for(i  in  a)}{print  i,a[i]}'  test.txt

提取host.txt主机名后再放回host.txt文件

awk  -F  '[  .]+'   '{print  $2}'  ms.txt文章来源地址https://www.toymoban.com/news/detail-621846.html

到了这里,关于正则表达式 —— Awk的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • linux中shell脚本——shell数组、正则表达式及文件三剑客之AWK

    目录 一.shell数组 1.1.数组分类 1.2.定义数组方法 二.正则表达式 2.1.元字符 2.2.表示次数 2.3.位置锚定 2.4.分组 2.5.扩展正则表达式 三.文本三剑客之AWK 3.1.awk介绍及使用格式 3.2.处理动作 3.3.awk选项 3.4.awk处理模式 2.5.awk常见的内置变量  2.6.if条件判断 1.1.数组分类 ①关联数组:必

    2024年02月12日
    浏览(52)
  • 【正则表达式】正则表达式常见匹配模式

    模式 描述 w 匹配字母数字及下划线 W 匹配非字母数字下划线 s 匹配任意空白字符,等价于 [tnrf]. S 匹配任意非空字符 d 匹配任意数字,等价于 [0-9] D 匹配任意非数字 A 匹配字符串开始 Z 匹配字符串结束,如果是存在换行,只匹配到换行前的结束字符串 z 匹配字符串结

    2024年02月09日
    浏览(81)
  • 【SQL-正则】利用正则表达式进行过滤操作(常用正则表达式)

    1、由数字、26个英文字母或者下划线组成的字符串 2、非负整数(正整数 + 0 ) 3、正整数 4、非正整数(负整数 + 0) 5、负整数 6、整数 7、非负浮点数(正浮点数 + 0) 8、正浮点数 9、非正浮点数(负浮点数 + 0) 10、负浮点数 11、浮点数 12、由26个英文字母组成的字符串 13、

    2024年02月12日
    浏览(81)
  • Python正则表达式之学习正则表达式三步曲

            正则表达式描述了一种字符串匹配的模式,可以用来检查一个串的有无某子串,或者做子串匹配替换,取出子串等操作。也可以说正则表达式就是字符串的匹配规则,也可以理解为是一种模糊匹配,匹配满足正则条件的字符串。         1、数据验证(eg:表单验

    2024年02月15日
    浏览(66)
  • Java 之正则表达式语法及常用正则表达式汇总

    正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为 regex、regexp 或 RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。 正则表达式是对字符串(包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称

    2024年02月09日
    浏览(71)
  • 老夫的正则表达式大成了,桀桀桀桀!!!【Python 正则表达式笔记】

    特殊字符 .^$?+*{}[]()| 为特殊字符,若想要使用字面值,必须使用 进行转义 字符类 [] [] 匹配包含在方括号中的任何字符。它也可以指定范围,例: [a-zA-Z0-9] 表示a到z,A到Z,0到9之间的任何一个字符 [u4e00-u9fa5] 匹配 Unicode 中文 [^x00-xff] 匹配双字节字符(包括中文) 在 [] 中

    2024年02月04日
    浏览(60)
  • 机器学习与数据科学-专题1 Python正则表达式-【正则表达式入门-1】

    为了完成本关任务,你需要掌握: 在 Python 中使用正则表达式; 最基础正则表达式; 正则匹配函数。 在 Python 中使用正则表达式 正可谓人生苦短,我用 Python。Python 有个特点就是库非常多,自然拥有正则匹配这种常见的库,并且此库已经嵌入在 Python 标准库中,使用起来非常

    2024年01月22日
    浏览(64)
  • 正则表达式 (用于灵活匹配文本的表达式)

    目录 . * 用于匹配任意单个字符,除了换行符。 例如使用正则表达式 a.b, 它可以匹配aab、acb、a#b 用于匹配前一个字符零次或多次。 例如,使用正则表达式 ab*c ,它可以匹配 \\\"ac\\\"、\\\"abc\\\"、\\\"abbc\\\",因为 b* 表示匹配零个或多个字符 \\\"b\\\"。所以,这个表达式可以匹配 \\\"ac\\\"(零个 \\\"b\\\"),

    2024年01月16日
    浏览(64)
  • 【编译原理】【词法分析】【正则表达式】【NFA】【DFA】【C++】正则表达式转DFA&NFA,判断字符串是否符合正则表达式的匹配算法

    显然,正则表达式、NFA、DFA的概念都很简单,所以直接上代码,注释应该解释地比较清楚, 没有万能头文件的自行替换需求库 ,如果有疑问的可以留言。 网盘链接 [自行补全]/s/1pbGT_wpB662TwFrnukXgGQ?pwd=TSIT 提取码:TSIT 原理可以参考这篇博客 传送门 本次程序由四个文件组成 文

    2024年02月11日
    浏览(88)
  • 利用正则表达式进行爬取数据以及正则表达式的一些使用方法

    Pattern:表示正则表达式 Matcher:文本匹配器,作用按照正则表达式的规则去读取字符串,从头开始读取。 在大串中去找符合匹配规则的子串。 代码示例: 需求: 把连接:https://m.sengzan.com/jiaoyu/29104.html?ivk sa=1025883i中所有的身份证号码都爬取出来。 代码示例: 需求: 把下面文

    2024年02月09日
    浏览(66)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包