1000字范文,内容丰富有趣,学习的好帮手!
1000字范文 > java使用正则表达式匹配不包含某个规则的字符串

java使用正则表达式匹配不包含某个规则的字符串

时间:2022-09-23 08:22:01

相关推荐

java使用正则表达式匹配不包含某个规则的字符串

Java|Java基础

java,正则表达式,不包含,规则,字符串

Java-Java基础

android gps定位有地图源码,vscode 弹窗输出,ubuntu虚拟机安装没反应,tomcat登录漏洞,获取sqlite所有字段,js时钟日历插件,做官网用什么前端框架,如何预防床上有爬虫,php 上传图片 代码,seo如何考核,php 电影网站,c 获取网页源代码,phpcms 添加内容模板lzw

ios 分享功能源码,vscode 分支合并,ubuntu显卡驱动删不了,tomcat小番茄,sqlite多进程读取,曲线图表插件,网页设计前端主流框架,爬虫调用页面js,php转换为数组,seo每日工作安排,餐饮网站 源代码,花店 网页模板,购物的静态网站模板,wordpress各个页面名称标签,红金羚crm客户管理系统,电脑算命建站程序lzw

测试数据:

电影 订票 app源码,ubuntu 引导界面花屏,Tomcat打不开do文件,爬虫爬简历,php缓存页面,seo泛目录怎么设置外推泛目录lzw

例如上面这几条简单的日志条目,我们想实现两个目标:

1、把8号的数据过滤掉;

2、把那些不包含robots.txt字符串的条目给找出来(只要Url中包含robots.txt的都给过滤掉)。

前瞻的语法是:

(?!匹配模式)

我们先来实现第一个目标——匹配不以特定字符串开头的条目。

这里我们因为要排除一段连续的字符串,因此匹配模式非常简单,就是-07-08。实现如下:

^(?!-07-08).*?$

用Expresso我们可以看到结果确实过滤掉8号的数据。

接下来,我们来实现第二个目标——排除包含特定字符串的条目。

按照我们上面写法,我照葫芦画瓢了一下:

^.*?(?!robots\.txt).*?$

这段正则用大白话描述就是:开头任意字符,然后后面不要跟着robots.txt连续字符串,然后再跟着任意个字符,字符串结尾。

运行测试,结果发现:

没有达到我们想要的效果。这是为什么呢?我们给上面的正则表达式加上两个捕获分组调试一下:

^(.*?)(?!robots\.txt)(.*?)$

测试结果:

我们看到,第一个分组啥都没有匹配到,而第二个分组却匹配了整个字符串。再回过头来好好分析一下刚才那个正则表达式。

实际上,当正则引擎解析到A区 域的时候,就已经开始执行B区域的前瞻工作。这个时候发现当A区域为Null的时候匹配成功——.*本来就允许匹配空字符,前瞻条件又满足,A区域后面紧 跟着的是“”字符串,而并不是robots。因此整个匹配过程成功匹配到所有条目。

分析出原因之后我们对上述的正则进行修正,将.*?移入前瞻表达式,如下:

^(?!.*?robots).*$

测试结果:

推荐教学:java开发入门

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。