您的位置 首页 php

PHP正则表达式核心技术完全详解 第11节贪婪匹配与禁止贪婪

 

PHP正则表达式中的贪婪匹配与 (禁止贪婪)


贪婪匹配

什么是贪婪匹配呢? 废话不多说 先看一段代码案例把 如下:

 $string='aaaaaaabbbbbbbbbbbbccccccc';
 //如下
 $pattern='/ab+/';
 //或者说是如下
 $pattern='/ab.+/';
 preg_match($pattern, $string,$arr);
 show($arr); 

php正则表达式默认就是贪婪的 解决贪婪匹配 的办法就是用 ? 号 所以阻止贪婪一般加? 来解决 代码如下:

 $string='aaaaaaabbbbbbbbbbbbccccccc';
 //如下
 $pattern='/ab+?/';
 //或者说是如下
 $pattern='/ab.+?/';
 preg_match($pattern, $string,$arr);
 show($arr); 

小案例1: 这里跟加不加s 视为单行字符有关系, 因为加了s 视为单行以后会产生贪婪匹配、所以阻止贪婪后 在进行全局搜索匹配! 代码如下:

 $string='test test  test test <a href="#34;>百度</a>
  test test test <a href="#34;>新浪</a>';
 
 //匹配网址
 $pattern='/http:\/\/(ftp|www)\.\w+.(com|org|net)/';
 //匹配href的内容  这里不加? 就会出现贪婪匹配
 $pattern='/href="(.+?)"/s';
 ​
 preg_match_all($pattern, $string,$arr);
 show($arr);
 ​ 

小案例2: 删除某一个class文件中的所有注释 例如:Car.class.php文件 内容如下:

  <?php
 ​
 /**
  * @description
  * @author 3#
  */
 interface Car{
     function run();
 }
 ​
 ​
 /**
  * 
  * @description 宝马车类
  *
  */
 class Bmw implements Car{
     public function run(){
         echo '宝马车子在跑!!';
     }
 }
 ​
 ​
 /**
  * @description 奔驰车类
  *
  */
 class Bz implements Car{
     public function run(){
         echo '奔驰车子在跑!!';
     }
 }
 ​
 ​
 // $Bmw=new Bmw();
 // $Bmw->run();
 // echo '<br>';
 // $Bz=new Bz();
 // $Bz->run();
 ​
 ?> 

然后处理这个Car.class.php中的注释,把里面的注释都删掉 通常我们是如下处理的

 //载入文件
 $file='./Car.class.php';
 $content=file_get_contents($file);
 //正则匹配
 $pattern='/\/\*\*.*\*\//s';
 //替换为空
 $result=preg_replace($pattern, '', $content);
 //最后把处理好的字符重新写入带文件中
 file_put_contents($file, $result); 

以上这样处理看似没什么问题,但是当你打开Car.class.php这个文件的时候你要大吃一惊的!! 现在Car.class.php里面应该只剩下 下面这个类了 其他的都不见了!!

 class Bz implements Car{
     public function run(){
         echo '奔驰车子在跑!!';
     }
 } 

原因 :如果这样替换会产生如下情况: 原因是;贪婪匹配 .* 匹配了/* 开始一直到 /结尾、 中间无论什么内容都被视为 . 的范畴之内了!

禁止贪婪

正确的做法是加上? 号 阻止贪婪匹配 代码如下:

 //载入文件
 $file='./Car.class.php';
 $content=file_get_contents($file);
 //正则匹配 并且禁止贪婪
 $pattern='/\/\*\*.*?\*\//s';
 //替换为空
 $result=preg_replace($pattern, '', $content);
 //最后把处理好的字符重新写入带文件中
 file_put_contents($file, $result); 

结果Car.class.php文件中的注释就全部删除了 ,Car.class.php文件中的代码如下:

 interface Car{
     function run();
 }
 ​
 ​
 ​
 class Bmw implements Car{
     public function run(){
         echo '宝马车子在跑!!';
     }
 }
 ​
 ​
 ​
 class Bz implements Car{
     public function run(){
         echo '奔驰车子在跑!!';
     }
 } 

小案例3 : 查找a出现1次到5次, 也包含之间的, 这种默认也是贪婪的,因为它会取出最大匹配的那一次! 也就是5次 如下代码:

$string='cbaaaaaa';
$pattern='/ba{1,5}/is';
preg_match($pattern, $string,$arr);
show($arr); 

加上 ? 号 以后 就可以阻止贪婪匹配 并且取出最小匹配次数 如下代码:

$string='cbaaaaaa';
$pattern='/ba{1,5}?/is';
preg_match($pattern, $string,$arr);
show($arr); 

小提示 : ??两个 问号就是完全取最小的 一个? 号表示取 0或者 1 两个?号就表示禁止贪婪 取完全最小值0, 例如:案例中一个?号表示还是取了1个a ,但是两个??问号就一定没有a了 因为两个?? 号表示0、等同于这样写: /ba{0}/ 代码如下:

$string='cbaaaaaa';
$pattern='/ba??/is';
preg_match($pattern, $string,$arr);
show($arr); 

 

文章来源:智云一二三科技

文章标题:PHP正则表达式核心技术完全详解 第11节贪婪匹配与禁止贪婪

文章地址:https://www.zhihuclub.com/79186.shtml

关于作者: 智云科技

热门文章

网站地图