今天遇到一個(gè)正則匹配的問題,忽然翻到有捕獲組的概念,手冊(cè)上也是一略而過,百度時(shí)無意翻到C#和Java中有對(duì)正則捕獲組的特殊用法,搜索關(guān)鍵詞有PHP時(shí)竟然沒有相關(guān)內(nèi)容,自己試了一下,發(fā)現(xiàn)在PHP中也是可行的,于是總結(jié)一下,分享的同時(shí)也希望有大神和細(xì)心的學(xué)習(xí)者找到我理解中出現(xiàn)的問題。
什么是捕獲組
我們先看一下PHP的正則匹配函數(shù)
1
|
int preg_match ( string $pattern , string $subject [, array & $matches [, int $flags = 0 [, int $offset = 0 ]]] ) |
前面兩項(xiàng)是我們常用的,$pattern是正則匹配模式,$string是要匹配的字符串。
array &$match,它是一個(gè)數(shù)組,&表示匹配出來的結(jié)果會(huì)被寫入$match中。
int $flags 如果傳遞了這個(gè)標(biāo)記, 對(duì)于每一個(gè)出現(xiàn)的匹配返回時(shí)會(huì)附加字符串偏移量(相對(duì)于目標(biāo)字符串的)。
int $offset 用于指定從目標(biāo)字符串的某個(gè)未知開始搜索(單位是字節(jié))。
我們主要看一下$match的值里會(huì)有什么:
1
2
3
4
5
6
7
|
$mode = '/a=(\d+)b=(\d+)c=(\d+)/' ; $str= '**a=4b=98c=56**' ; $res=preg_match($mode,$str,$match); var_dump($match); |
結(jié)果如下:
1
2
3
4
5
|
array (size=4) => string 'a=4b=98c=56' (length=11) => string '4' (length=1) => string '98' (length=2) => string '56' (length=2) |
現(xiàn)在我們知道了什么是捕獲組,捕獲組是正則表達(dá)示中以()括起來的部分,每一對(duì)()是一個(gè)捕獲組。
PHP會(huì)為它編號(hào),從1開始。至于為什么會(huì)從1開始,那是因?yàn)镻HP把匹配到的完整字符串編號(hào)為0。
如果有多個(gè)括號(hào)或嵌套括號(hào),按左邊括號(hào)出現(xiàn)的順序來進(jìn)行編號(hào),如圖:
按圖中的匹配模式匹配時(shí),捕獲組的123號(hào)分別是紅綠藍(lán)。
捕獲組的忽略與命名
我們還可以阻止PHP為匹配組的編號(hào):在匹配組中模式前加 ?:
$mode = '/a=(\d+)b=(?:\d+)c=(\d+)/';
這樣,匹配結(jié)果就會(huì)變成:
1
2
3
4
|
array (size=3) => string 'a=4b=98c=56' (length=11) => string '4' (length=1) => string '56' (length=2) |
當(dāng)然,我們也可以在括號(hào)的內(nèi)部為它給它獨(dú)特的名字。
命名子組可以接受(?<name>), (?'name') 以及(?P<name>)語法. 之前版本僅接受(?P<name>)語法.
例如:$mode = '/a=(\d+)b=(?P<sec>\d+)c=(\d+)/';
使用時(shí)結(jié)果為:
1
2
3
4
5
6
7
|
array (size=5) => string 'a=4b=98c=56' (length=11) => string '4' (length=1) 'sec' => string '98' (length=2) => string '98' (length=2) => string '56' (length=2) |
在保留索引數(shù)組的同時(shí),加上一個(gè)關(guān)聯(lián)項(xiàng),key值為捕獲組名。
捕獲組的反向引用
我們?cè)谟胮reg_replace()函數(shù)進(jìn)行正則替換時(shí),我們還可以使用 \n 或 $n 來引用第n個(gè)捕獲組.
1
2
3
4
5
6
7
|
$mode = '/a=(\d+)b=(\d+)c=(\d+)/' ; $str= '**a=4b=98c=56**' ; $rp= '\1/$2/\3/' ; echo preg_replace($mode,$rp,$str); //**4/98/56/** |
\1表示捕獲組1(4),$2為捕獲組2(98),\3為捕獲組3(56)。
非捕獲組的用法:
為什么稱為非捕獲組呢?那是因?yàn)樗鼈冇胁东@組的特性,在匹配模式的()中,但是匹配時(shí),PHP不會(huì)為它們編組,它們只會(huì)影響匹配結(jié)果,并不作為結(jié)果輸出。
/d(?=xxx) 匹配"后面是xxx的一個(gè)數(shù)字"。
注意格式:只能放在匹配模式字符串之后!
例如:
1
2
3
4
5
6
7
|
$pattern= '/\d(?=abc)/' ; $str= "ab36abc8eg" ; $res=preg_match($pattern,$str,$match); var_dump($match); //6 |
匹配的6,因?yàn)橹挥兴鳛橐粋€(gè)數(shù)字,后面還有abc。
(?<=xxx) /d 匹配"前面是xxx的一個(gè)數(shù)字"
注意格式:只能放在匹配模式字符串之前!
例如:
1
2
3
4
5
6
7
|
$pattern= '/(?<=abc)\d/' ; $str= "ab36abc8eg" ; $res=preg_match($pattern,$str,$match); var_dump($match); //8 |
匹配的8,因?yàn)橹挥兴鳛橐粋€(gè)數(shù)字,后面還有abc。
與(?=xxx) (?<=xxx)相對(duì)的是(?!=xxx) (?<!=xxx) 它們?cè)?前加了非運(yùn)算符 “!”
它表示前面/后面不是xxx的字符串,這里就不再舉例了。
以上這篇淺談PHP正則中的捕獲組與非捕獲組就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持服務(wù)器之家。