这篇文章主要介绍java中如何使用正则表达式中的组,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!
组是括号划分的正则表达式,可以根据组的编号来引用某个组。组号为0表示整个表达式,组号1表示从左到右被第一个括号扩起的组,以此类推。
例如:
A(B(CD))E中有三个组:组0是ABCDE,组1是BCD,组2是CD。
Matcher对象提供了一系列方法,用以获取与组相关的信息:
方法作用
public int groupCount()返回该匹配器的模式中的分组数目,第0组不包括在内
public String group()返回前一次匹配操作的第0组(整个匹配)
public String group(int i)返回在前一次匹配操作期间的指定的组号
public int start(int group)返回在前一次匹配操作中寻找到的组的起始索引
public int end(int group)返回在前一次匹配操作中寻找到的组的最后一个字符索引加一的值
例子:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class GroupsDemo {
static public final String POEM="Twas brilling, and the slithy toves\n"
+ "Did gyre and gimble in the wabe.\n"
+ "All mimsy were the borogoves,\n"
+ "And the mome raths outgrabe.\n";
public static void main(String[] args) {
/*
* Patten.MULTILINE为模式标记,表示多行模式,在多行模式下,表达式^和$分别匹配一行的开始和结束,也可以匹配输入字符串的开始和结束
* \S+表示一次以上的非空格字符,s+表示一次以上的空格字符,目的匹配每行的最后3个字符。
*/
Matcher m=Pattern.compile("(\\S+)\\s+((\\S+)\\s+(\\S+))$",Pattern.MULTILINE).matcher(POEM);
while (m.find()) {
for (int i = 0; i <=m.groupCount(); i++) {
System.out.print("第"+i+"组是:"+"["+m.group(i)+"] ");
}
System.out.println();
}
}
}
运行结果:
第0组是:[the slithy toves] 第1组是:[the] 第2组是:[slithy toves] 第3组是:[slithy] 第4组是:[toves]
第0组是:[in the wabe.] 第1组是:[in] 第2组是:[the wabe.] 第3组是:[the] 第4组是:[wabe.]
第0组是:[were the borogoves,] 第1组是:[were] 第2组是:[the borogoves,] 第3组是:[the] 第4组是:[borogoves,]
第0组是:[mome raths outgrabe.] 第1组是:[mome] 第2组是:[raths outgrabe.] 第3组是:[raths] 第4组是:[outgrabe.]
start()和end()的使用:
在匹配操作成功之后,start()返回先前匹配的起始位置的索引,而end()返回所匹配的最后字符的索引加一的值。如果匹配操作失败后(或先于一个正在进行的匹配操作去操作)调用start()或end()将会产生IllegalStateException.
下面是使用例子:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class GroupsDemo {
static public final String POEM="Twas brilling, and the slithy toves\n"
+ "Did gyre and gimble in the wabe.\n"
+ "All mimsy were the borogoves,\n";
public static void main(String[] args) {
/*
* Patten.MULTILINE为模式标记,表示多行模式,在多行模式下,表达式^和$分别匹配一行的开始和结束,也可以匹配输入字符串的开始和结束
* \S+表示一次以上的非空格字符,s+表示一次以上的空格字符,目的匹配每行的最后3个字符。
*/
Matcher m=Pattern.compile("(\\S+)\\s+((\\S+)\\s+(\\S+))$",Pattern.MULTILINE).matcher(POEM);
while (m.find()) {
System.out.print("起始索引为:"+m.start());
System.out.println("结束索引为:"+m.end());
for (int i = 0; i <=m.groupCount(); i++) {
System.out.print("第"+i+"组是:"+"["+m.group(i)+"] ");
System.out.print("该组的起始索引为:"+m.start(i));
System.out.println("该组的结束索引为:"+m.end(i));
}
System.out.println();
}
}
}
运行结果:
起始索引为:19结束索引为:35
第0组是:[the slithy toves] 该组的起始索引为:19该组的结束索引为:35
第1组是:[the] 该组的起始索引为:19该组的结束索引为:22
第2组是:[slithy toves] 该组的起始索引为:23该组的结束索引为:35
第3组是:[slithy] 该组的起始索引为:23该组的结束索引为:29
第4组是:[toves] 该组的起始索引为:30该组的结束索引为:35
起始索引为:56结束索引为:68
第0组是:[in the wabe.] 该组的起始索引为:56该组的结束索引为:68
第1组是:[in] 该组的起始索引为:56该组的结束索引为:58
第2组是:[the wabe.] 该组的起始索引为:59该组的结束索引为:68
第3组是:[the] 该组的起始索引为:59该组的结束索引为:62
第4组是:[wabe.] 该组的起始索引为:63该组的结束索引为:68
起始索引为:79结束索引为:98
第0组是:[were the borogoves,] 该组的起始索引为:79该组的结束索引为:98
第1组是:[were] 该组的起始索引为:79该组的结束索引为:83
第2组是:[the borogoves,] 该组的起始索引为:84该组的结束索引为:98
第3组是:[the] 该组的起始索引为:84该组的结束索引为:87
第4组是:[borogoves,] 该组的起始索引为:88该组的结束索引为:98
以上是“java中如何使用正则表达式中的组”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注亿速云行业资讯频道!
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。
原文链接:http://blog.itpub.net/69960171/viewspace-2674310/