本文實例講述了正則表達(dá)式教程之子表達(dá)式用法。分享給大家供大家參考,具體如下:
注:在所有例子中正則表達(dá)式匹配結(jié)果包含在源文本中的【和】之間,有的例子會使用java來實現(xiàn),如果是java本身正則表達(dá)式的用法,會在相應(yīng)的地方說明。所有java例子都在JDK1.6.0_13下測試通過。
一、問題引入
首先來看一個例子,有的短語如Windows 2000雖然是多個單詞組成,但其實是一個整體,HTML頁面中可以使用非換行空格(nbsp;即non-breaking space)讓它在瀏覽器中顯示在一行上,現(xiàn)在來匹配多個這樣的空格:
文本:Your operation systemis Windowsnbsp;nbsp;nbsp;2000.
正則表達(dá)式:nbsp;{2,}
結(jié)果:Your operation systemis Windowsnbsp;nbsp;nbsp;2000.
分析:這里使用模式想匹配2個或2個以上的非換行空格,但是從結(jié)果可以看出,沒有匹配到任何東西,因為nbsp;{2,}這個模式只能匹配到像nbsp;;;;;;;這樣以nbsp開頭,2個或2個以上連續(xù)分號的文本。
因為前面說過的重復(fù)匹配都是緊挨著重復(fù)匹配元字符之前的那個字符的多次重復(fù),但是,如果我們想對一個字符串進(jìn)行多次匹配,又該怎么做呢?
二、子表達(dá)式
從上面我們引出子表達(dá)式。子表達(dá)式是一個大的表達(dá)式的一部分,把一個表達(dá)式劃分為多個子表達(dá)式的目的是為了把那些子表達(dá)式當(dāng)作一個獨立的元素來使用。子表達(dá)式必須用(和)括起來。所以,前面的例子中正則表達(dá)式應(yīng)該寫成(nbsp;){2,}。
來看一個匹配有效年份的正則:
文本:1988-11-13
正則表達(dá)式:(19|20)\d{2}
結(jié)果:【1988】-11-13
分析:這個例子中,為了排除沒有意義的年份,把年份的前兩位數(shù)字限定為19或20,|是正則表達(dá)式里的或操作符。這里必須把19|20放到一個子表達(dá)式里,即(19|20),否則只能匹配到以20開頭的年份,
三、子表達(dá)式的嵌套
子表達(dá)式允許嵌套,而且允許多層嵌套,嵌套層次在理論上沒有限制。
在表達(dá)式 ((A)(B(C))) 中,存在以下幾個子表達(dá)式:
1 ((A)(B(C)))
2 (A)
3 (B(C))
4 (C)
共4個,第0個始終代表整個表達(dá)式。在后面的回溯引用中會介紹到通過\n(n是子表式的編號)來引用子表達(dá)式。
子表達(dá)式嵌套的例子可參看后面匹配IPV4地址的正則表達(dá)式。
PS:這里再為大家提供2款非常方便的正則表達(dá)式工具供大家參考使用:
JavaScript正則表達(dá)式在線測試工具:
http://tools.jb51.net/regex/javascript
正則表達(dá)式在線生成工具:
http://tools.jb51.net/regex/create_reg
希望本文所述對大家正則表達(dá)式學(xué)習(xí)有所幫助。
您可能感興趣的文章:- 正則表達(dá)式查找相似單詞的方法
- 學(xué)習(xí)Java正則表達(dá)式(匹配、替換、查找)
- 正則表達(dá)式匹配,替換,查找
- JAVA中正則表達(dá)式匹配,替換,查找,切割的方法
- js正則查找match()與替換replace()用法實例
- Powershell學(xué)習(xí)筆記--使用正則表達(dá)式查找文件
- 如何在PHP中使用正則表達(dá)式進(jìn)行查找替換
- 用正則查找html中有id屬性的html標(biāo)簽
- 正則表達(dá)式驗證IPV4地址功能實例分析
- 正則表達(dá)式教程之位置匹配詳解
- 正則表達(dá)式教程之重復(fù)匹配詳解
- 正則表達(dá)式教程之操作符及說明詳解
- 正則表達(dá)式教程之前后查找lookaround詳解