Java 正则表达式【基本语法】

这篇具有很好参考价值的文章主要介绍了Java 正则表达式【基本语法】。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

基本介绍

首先我们需要了解的是正则表达式中的各种元字符的功能,主要分为以下几种:

  1. 限定符
  2. 选择匹配符
  3. 分组组合和反向引用符
  4. 特殊字符
  5. 字符匹配符
  6. 定位符

需要注意的是:在 Java正则表达式中,两个斜杠 \\ 相当于其它语言中的一个斜杠 \ 。

字符匹配符

符号 含义 示例 解释
[ ] 可以匹配的字符列表 [abcjs] a、b、c、j、s都可以匹配到
[^] 不可以被匹配的字符列表 [^abc] a、b、c不可以被匹配
- 连字符 a-z 可以匹配任意a到z的字母
. 匹配除 \n 之外的任何字符 a..b 以a开头b结尾的字符串,中包括任意两个字符
\\d 匹配单个数字字符 \\d{3}(\\d)? 匹配连续3个或4个数字的字符串
\\D 匹配非数字字符 \\D(\\d)* 以单个非数字字符开头,后面接任意个数字的字符串
\\w 匹配单个数字、英文字符、下划线 \\d{3}\\w{4} 以3个数字字符开头的长度为7的数字字母字符串
\\W 匹配单个非数字、非英文字符、非下划线 \\W+\\d{2} 以至少一个非数字字母字符开头,两个数字字符结尾的字符串
\\s 匹配任何空白字符(空格,制表符等)
\\S 匹配任何非空白字符,和\s刚好相反

Java 正则表达式默认是区分大小写的,如何实现不区分大小写?

(?i)abc​​​
abc 都不区分大小写
a(?i)bc
bc 不区分大小写
a((?i)b)c
只有 b不区分大小写
Pattern.compile(regex,Pattern.CASE_INSENSITIVE) 方法参数内设置忽略大小写

选择匹配符

符号 含义 示例 解释
| 或者的意思 ab|cd 匹配ab或者cd

用于在匹配时有选择的降低匹配标准。 

限定符

用于指定其前面的字符和组合项连续出现多少次

符号 含义 示例 说明 示例
* 重复0次或n次 (abc)* 以abc开头的,子串只包含abc的字符串 abc,abcabc
+ 重复1次或多次 (abc)+ 至少以1个abc开头,子串只包含abc的字符串 abc,abcabc
重复0次或1次 (abc)? 以abc开头的字符串 abc
{n} 限定只能出现n次 [a-d]{3} 由连续的 a、b、c、d组成的字符串中任意长度为3子串

定位符

规定要匹配的字符在字符串中出现的位置,比如是在字符串开始还是在结束处。

符号 含义
^ 开头
$ 结尾
\\b 匹配目标字符串的边界,子串之间的空格
\B 匹配字符的非边界

这里主要演示一下 \\b 和 \\B :

public static void main(String[] args) {
        String content = "我爱学习 学习不爱我 学习很快乐";

        String regex = "学习\\B";
        Pattern compile = Pattern.compile(regex);
        Matcher matcher = compile.matcher(content);
        while (matcher.find()){
            System.out.println(matcher.group());
        }
    }

当我们设置匹配语句为 \\b 的时候,输出结果:

学习

当我们设置匹配语句为 \\B 的时候,输出结果:

学习
学习

可以看到,\\b 匹配的是子串"学习"后是空格的,而 \\B 刚好相反。

分组

捕获分组

我们上一篇博客写过分组的案例,也就是 group(0),group(1)这种,也叫做非命名捕获。

这里主要介绍一种新的分组方法,叫做命名捕获,也就是说我们可以自定义组的名字。相比较之前的哪一种,它既可以使用非命名捕获(通过组号获取匹配的子串),也可以通过自定义的名字来捕获。

语法:<?<name><pattern>> 

其中,需要先写一个问号?,<name>是我们对组的命名,不要太离谱就行;<pattern>是我们的正则表达式,和非命名捕获是一样的。

String content = "sajnj ax1122s sjnaj4529 s584";

        String regex = "(?<group1>\\d\\d)(?<group2>\\d\\d)";
        Pattern compile = Pattern.compile(regex);
        Matcher matcher = compile.matcher(content);
        while (matcher.find()){
            System.out.println(matcher.group("group1"));
            System.out.println(matcher.group("group2"));
        }

非捕获分组

        Java正则表达式中的不捕获匹配(Non-capturing Group)指的是使用括号来分组匹配,但不会将该分组的匹配结果保存到匹配结果中。这样可以在正则表达式中使用括号进行逻辑分组,但不会捕获分组的内容,从而减少内存开销并提高性能。

        也就是说,虽然有括号但是不算是一个组,你使用组索引 matcher.group(n) 是获取不到结果的。

String content = "industries industry";

        Pattern pattern = Pattern.compile("industr(?:y|ies)");

        Matcher matcher = pattern.matcher(content);

        while (matcher.find()){
            System.out.println(matcher.group(0));
        }

输出:

industries
industry

 

常用分组构造形式 说明
(?:pattern) 匹配 pattern 但不捕获该匹配的子表达式,即它是一个非捕获匹配,常用来代替我们的或( | )语句。
(?=pattern)

它是一个非捕获匹配(正向预查)。例如 "Windows (?=95|98|NT|2000)" 匹配 "Windows 2000"中的 "Windows",但不匹配 "Windows 3.1"中的 "Windows'。

"(?=95|98|NT|2000)":正向预查,用于确定在匹配 "Windows" 后面的字符串是 "95"、"98"、"NT" 或者 "2000"。它使用了竖线字符 "|" 来表示 "或" 的关系,即满足其中一个条件即可。注意,这个预查不会消费输入字符串,也不会将 "95"、"98"、"NT" 或者 "2000" 匹配结果保存到匹配结果中。
因此,这个正则表达式可以匹配"Windows95"、"Windows98"、"WindowsNT" 和"Windows2000",但不会匹配 "WindowsXP" 或者"Windows10"。它可以用于查找包含特定版本的 "Windows" 字符串,用于特定的匹配需求。

(?!attern) 它也是一个非捕获匹配(负向预查)。假设有一个正则表达式 (?!abc),它表示匹配任意一个不以 "abc" 结尾的字符串。例如 "Windows (?=95|98|NT|2000)" 匹配 "Windows XP"中的 "Windows",但不匹配 "Windows 2000"中的 "Windows'。
正向预查 
String content = "My operating system is Windows 11,his operating system is Windows XP";

        Pattern pattern = Pattern.compile("Windows (?=11|XP)");

        Matcher matcher = pattern.matcher(content);

        while (matcher.find()){
            System.out.println(matcher.group(0));
        }

运行结果:

Windows
Windows

        调试正则表达式后,发现 (?=pattern)这种非捕获分组,它必须满足括号后面的条件才能被匹配,但是比如"Windows (?=11|XP)",要被匹配到的只可能是 "Windows 11" 或者 "Windows XP",但是这里的"11"和"XP"不会被保存到结果。

负向预查
String content = "My operating system is Windows 11,his operating system is Windows XP";

        Pattern pattern = Pattern.compile("Windows (?!8|9|10)");

        Matcher matcher = pattern.matcher(content);

        while (matcher.find()){
            System.out.println(matcher.group(0));
        }

运行结果: 

Windows
Windows

        调试正则表达式后,发现 (?!pattern)这种非捕获分组,它必须满足括号后面的条件才能被匹配,但是比如"Windows (?=11|XP)",要被匹配到的只可能是除了 "Windows 11" 和 "Windows XP"之外的其他"Windows xxxx"的字符串,而且这里的"xxxx"同样不会被保存到结果。 文章来源地址https://www.toymoban.com/news/detail-641905.html

到了这里,关于Java 正则表达式【基本语法】的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Java正则表达式

    正则表达式 能够理解正则表达式的作用 能够使用正则表达式的字符类 能够使用正则表达式的逻辑运算符 能够使用正则表达式的预定义字符类 能够使用正则表达式的限定符 能够使用正则表达式的分组 能够在String的split方法中使用正则表达式 在Java中,我们经常需要验证一些

    2024年01月19日
    浏览(31)
  • 正则表达式(Java)

    正则表达式是由一些特定的字符组成,代表一个规则,可以用来检验数据格式是否合法,也可以在一段文本中查找满足要求的内容。 如果使用代码检验数据是否正确: 使用正则表达式: String提供了一个匹配正则表达式的方法:  图片来源heimait \\\\d才会当成d使用 (?i)表示忽略大

    2024年02月20日
    浏览(37)
  • 正则表达式(JAVA)

    正则表达式在用于 校验信息 是否 满足某些规则 的时候,非常的好用 在 文本中查找 满足要求的内容 符号 作用 补充 [abc] 只能是a,b或c 匹配的一个字符只能是 [] 范围内的其中一个 [^abc] 除了a,b,c之外的任何字符 ^ 符号类似 非 [a-zA-Z] a到z A到Z ,包括范围 - 作用是由…到… ,两个或

    2024年02月10日
    浏览(29)
  • JAVA系列---正则表达式

    编号 元字符 匹配功能 1 . 匹配除换⾏符以外的任意字符 2 w 匹配字⺟或数字或下划线 3 s 匹配任意的空⽩符 4 d 匹配数字 5 n 匹配⼀个换⾏符 6 t 匹配⼀个制表符 7 ^ 匹配字符串的开始 8 $ 匹配字符串的结尾 9 W 匹配⾮字⺟或数字或下划线 10 D 匹配⾮数字 11 S 匹配⾮空⽩符

    2024年02月15日
    浏览(48)
  • JAVA中正则表达式

    接下来,学习一个全新的知识,叫做正则表达式。 正则表达式其实是由一些特殊的符号组成的,它代表的是某种规则。 正则表达式的作用1:用来校验字符串数据是否合法 正则表达式的作用2:可以从一段文本中查找满足要求的内容 5.1 正则表达式初体验 现在,我们就以QQ号码

    2024年01月20日
    浏览(38)
  • Java的正则表达式

    正则表达式是一种强大的字符串匹配工具,可以在很多领域得到广泛使用。在Java中,正则表达式也被广泛应用于字符串匹配、查找和替换等方面。本文将介绍Java中常用的正则表达式语法以及其使用方法,供大家参考。 Java中使用正则表达式需要使用java.util.regex包中的类。其中

    2024年02月07日
    浏览(41)
  • Java038——正则表达式

    正则表达式通常被用于判断语句中,用来检查某一字符串是否满足某一格式。正则表达式是含有一些具有特殊意义字符的字符串,这些特殊字符称为正则表达式的元字符。例如,“d”表示数字 0~9 中的任何一个,“d”就是元字符。正则表达式中的元字符及其意义下所示。 在

    2024年02月13日
    浏览(25)
  • Java 正则表达式匹配

    正则表达式: 定义一个搜索模式的字符串。 正则表达式可以用于搜索、编辑和操作文本。 正则对文本的分析或修改过程为:首先正则表达式应用的是文本字符串(text/string),它会以定义的模式从左到右匹配文本,每个源字符只匹配一次。 正则表达式 匹配 this is text 精确匹配

    2024年02月06日
    浏览(42)
  • 【Java 基础篇】Java 正则表达式

    正则表达式是一种强大的文本模式匹配工具,它可以帮助我们在文本中查找、替换和提取特定模式的内容。Java 提供了丰富的正则表达式支持,通过 java.util.regex 包中的类和方法,我们可以在 Java 程序中使用正则表达式进行字符串处理。 本篇博客将介绍 Java 正则表达式的基本

    2024年02月09日
    浏览(40)
  • JAVA Android 正则表达式

    正则表达式是对字符串执行模式匹配的技术。 如果要想灵活的运用正则表达式,必须了解其中各种元字符的功能,元字符从功能上大致分为: 1、限定符 2、选择匹配符 3、分组组合和反向引用符 4、特殊字符 5、字符匹配符 6、定位符 元字符(Metacharacter)-转义号 \\\\ 符号说明: 在我

    2024年02月13日
    浏览(25)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包