好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

主頁 > 知識庫 > 正則表達式教程之元字符的使用詳解

正則表達式教程之元字符的使用詳解

熱門標簽:西藏智能外呼系統代理商 呼叫系統外呼只能兩次 貴港公司如何申請400電話 地圖標注教學點 甘肅醫療外呼系統排名 梅縣地圖標注 ai電話機器人搭建 400電話辦理電話辦理 外呼系統無呼出路由是什么原因

本文實例講述了正則表達式教程之元字符的使用。分享給大家供大家參考,具體如下:

注:在所有例子中正則表達式匹配結果包含在源文本中的之間,有的例子會使用Java來實現,如果是java本身正則表達式的用法,會在相應的地方說明。所有java例子都在JDK1.6.0_13下測試通過。

一、對特殊字符進行轉義

元字符是一些在正則表達式里有著特殊含義的字符。因為元字符在正則表達式里有著特殊的含義,所以這些字符就無法用來代表它們本身。在元字符前面加上一個反斜杠就可以對它進行轉義,這樣得到的轉義序列將匹配那個字符本身而不是它特殊的元字符含義。如,如果想要匹配[和],就必須對它進行轉義:


。

對元字符轉義需要用到斜杠\字符,這就意味著\字符本向也是一個元字符,要匹配\字符本身,必須轉義成\\。如匹配windows文件路徑。

二、匹配空白字符

元字符大致可以分為兩種:一種是用來匹配文本的(如.),另一種是正則表達式的語法所要求的(如[和])。

在進行正則表達式搜索的時候,我們經常會遇到需要對原始文本中里的非打印空白字符進行匹配的情況。比如說,我們可能需要把所有的制表符找出來,或者我們需要把換行符找出來,這類字符很難被直接輸入到一個正則表達式里,這時我們可以使用如下列出的特殊元字符來輸入它們:

\b 回退(并刪除)一個字符(Backspace鍵)
\f 換頁符
\n 換行符
\r 回車符
\t 制表符(Tab鍵)
\v 垂直制表符

來看一個例子,把文件中的空白行去掉:

文本:

8 5 4 1 6 3  2 7 9
7 6 2 9 5 8  3 4 1
9 3 1 4 2 7  8 5 6

6 9 3 8 7 5  1 2 4
5 1 8 3 4 2  6 9 7
2 4 7 6 1 9  5 3 8

3 26  7 8 4 9 1 5
4 8 9 5 3 1  7 6 2
1 7 5 2 9 6  4 8 3

正則表達式:\r\n\r\n

分析:\r\n匹配一個回車+換行組合,windows操作系統中把它作為文本行的結束標簽。使用正則表達式\r\n\r\n進行的搜索將匹配兩個連續的行尾標簽,而這正好是空白行。

注意:Unix和Linux操作系統中只使用一個換行符來結束一個文本行,換句話說,在Unix或Linux系統中匹配空白行只使用\n\n即可,不需要加上\r。同時適用于windows和Unix/Linux的正則表達式應該包括一個可先的\r和一個必須匹配的\n,即\r?\n\r?\n,這將會在后面的文章中講到。

Java代碼如下:

public static void matchBlankLine() throws Exception{
  BufferedReader br = new BufferedReader(new FileReader(new File("E:/九宮格.txt")));
  StringBuilder sb = new StringBuilder();
  char[] cbuf = new char[1024];
  int len = 0;
  while(br.ready()  (len = br.read(cbuf)) > 0){
    br.read(cbuf);
    sb.append(cbuf, 0, len);
  }
  String reg = "\r\n\r\n";
  System.out.println("原內容:\n" + sb.toString());
  System.out.println("處理后:-----------------------------");
  System.out.println(sb.toString().replaceAll(reg, "\r\n"));
}

運行結果如下:

原內容:

8 5 4 1 6 3 2 7 9
7 6 2 9 5 8 3 4 1
9 3 1 4 2 7 8 5 6

6 9 3 8 7 5 1 2 4
5 1 8 3 4 2 6 9 7
2 4 7 6 1 9 5 3 8

3 2 6 7 8 4 9 1 5
4 8 9 5 3 1 7 6 2
1 7 5 2 9 6 4 8 3

 
處理后:-----------------------------

8 5 4 1 6 3 2 7 9
7 6 2 9 5 8 3 4 1
9 3 1 4 2 7 8 5 6
6 9 3 8 7 5 1 2 4
5 1 8 3 4 2 6 9 7
2 4 7 6 1 9 5 3 8
3 2 6 7 8 4 9 1 5
4 8 9 5 3 1 7 6 2
1 7 5 2 9 6 4 8 3

三、匹配特定的字符類別

字符集合(匹配多個字符中的某一個)是最常見的匹配形式,而一些常用的字符集合可以用特殊元字符來代替。這些元字符匹配的是某一類別的字符(類元字符),類元字符并不是必不可少的,因為可以通過逐一列舉有關字符或通過定義一個字符區間來匹配某一類字符,但是使用它們構造出來的正則表達式簡明易懂,在實際應用中很常用。

1、匹配數字與非數字

\d 任何一個數字,等價于[0-9]或[0123456789]
\D 任何一個非數字,等價于[^0-9]或[^0123456789]

2、匹配字母和數字與非字母和數字

字母(A-Z不區分大小寫)、數字、下劃線是一種常用的字符集合,可用如下類元字符:

\w 任何一個字母(不區分大小寫)、數字、下劃線,等價于[0-9a-zA-Z_]
\W 任何一個非字母數字和下劃線,等價于[^0-9a-zA-Z_]

3、匹配空白字符與非空白字符

\s 任何一下空白字符,等價于[\f\n\r\t\v]
\S 任何一下空白字符,等價于[^\f\n\r\t\v]

注意:退格元字符\b沒有不在\s的范圍之內。

4、匹配十六進制或八進制數值

十六進制:用前綴\x來給出,如:\x0A對應于ASCII字符10(換行符),其效果等價于\n。
八進制:用前綴\0來給出,數值本身可以是兩位或三位數字,如:\011對應于ASCII字符9(制表符),其效果等價于\t。

四、使用POSIX字符類

POSIX字符類是很多正則表達式實現都支持的一種簡寫形式。Java也支持它,但JavaScript不支持。POSIX字符如下所示:

[:alnum:] 任何一個字母或數字,等價于[a-zA-Z0-9]
[:alpha:] 任何一個字母,等價于[a-zA-Z]
[:blank:] 空格或制表符,等價于[\t]
[:cntrl:] ASCII控制字符(ASCII 0到31,再加上ASCII 127)
[:digit:] 任何一個數字,等價于[0-9]
[:graph:] 任何一個可打印字符,但不包括空格
[:lower:] 任何一個小寫字母,等價于[a-z]
[:print:] 任何一個可打印字符
[:punct:] 既不屬于[:alnum:]和[:cntrl:]的任何一個字符
[:space:] 任何一個空白字符,包括空格,等價于[^\f\n\r\t\v]
[:upper:] 任何一個大寫字母,等價于[A-Z]
[:xdigit:] 任何一個十六進制數字,等價于[a-fA-F0-9]

POSIX字符和之前見過的元字符不太一樣,我們來看一個前面利用正則表達式來匹配網頁中的顏色的例子:

文本:span style="background-color:#3636FF;height:30px;width:60px;">測試/span>

正則表達式:#[[:xdigit:]] [[:xdigit:]] [[:xdigit:]] [[:xdigit:]] [[:xdigit:]] [[:xdigit:]]

結果:span style="background-color:【#3636FF】;height:30px;width:60px;">測試/span>

注意:這里使用的模式以[[開頭、以]]結束,這是使用POSIX字符類所必須的,POSIX字符必須括在[:和:]之間,外層[和]字符用來定義一個集合,內層的[和]字符是POSIX字符類本身的組成部分。

在java中的POSIX字符表示有所不同,不是包括在[:和:]之間,而是以\p開頭,包括在{和}之間,且大小寫有區別,同時增加了\p{ASCII},如下所示:

\p{Alnum} 字母數字字符:[\p{Alpha}\p{Digit}]
\p{Alpha} 字母字符:[\p{Lower}\p{Upper}]
\p{ASCII} 所有 ASCII:[\x00-\x7F]
\p{Blank} 空格或制表符:[ \t]
\p{Cntrl} 控制字符:[\x00-\x1F\x7F]
\p{Digit} 十進制數字:[0-9]
\p{Graph} 可見字符:[\p{Alnum}\p{Punct}]
\p{Lower} 小寫字母字符:[a-z]
\p{Print} 可打印字符:[\p{Graph}\x20]
\p{Punct} 標點符號:!"#$%'()*+,-./:;=>?@[\]^_`{|}~
\p{Space} 空白字符:[ \t\n\x0B\f\r]
\p{Upper} 大寫字母字符:[A-Z]
\p{XDigit} 十六進制數字:[0-9a-fA-F]

PS:這里再為大家提供2款非常方便的正則表達式工具供大家參考使用:

JavaScript正則表達式在線測試工具:
http://tools.jb51.net/regex/javascript

正則表達式在線生成工具:
http://tools.jb51.net/regex/create_reg

希望本文所述對大家正則表達式學習有所幫助。

您可能感興趣的文章:
  • 正則表達式\d元字符(相對于數字0-9)
  • 正則表達式\w元字符使用介紹
  • 正則表達式(regex)入門、元字符(特殊字符)學習與提高
  • 正則表達式常用元字符整理小結
  • PHP正則表達式基本函數 修飾符 元字符和需轉義字符說明
  • JavaScript學習總結之正則的元字符和一些簡單的應用

標簽:大興安嶺 本溪 涼山 哈密 湖州 常州 泰安

巨人網絡通訊聲明:本文標題《正則表達式教程之元字符的使用詳解》,本文關鍵詞  正則,表達式,教程,之元,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《正則表達式教程之元字符的使用詳解》相關的同類信息!
  • 本頁收集關于正則表達式教程之元字符的使用詳解的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 亚洲欧美日韩中文字幕在线| 狠狠色噜狠狠狠狠| 一女多男在疯狂伦交在线观看| 无码无遮挡成人A片是什么意思| 亚洲秘?AV无码一区二区qq群| 国产好紧好爽好大再浪一点| 性猛交AAAA片免费观看直播| 免费观看欧美成人AA片爱我多深| 亚洲精品网站在线| 男和女全身脱了内裤还亲| 国产拍拍拍| 91丨国产丨白浆秘?洗澡动漫| 苏畅mdx6603在线观看免费观看| feexxx日本| 男人解开女人乳罩吃奶的图片| 小荡货你夹得我又紧又爽动态图| 女人脱精光直播app大全快三| 男女在床视频免费观看| 中文字幕无线码中文字幕免费| 亚洲综合色秘密影院秘密影院| 91久久偷偷做嫩草影院| 天堂网ww| 永久看日本大片免费35分钟| 亚洲国产精品不卡在线电影| 国产精品久久欠久久久久久九秃 | 0和1开车照片| 韩国19禁高潮床戏无遮挡| 精品久久一区二区三区| black强行japanesehd| 婷奴的七天性调教| 欧美性网址| 久久精品国产亚洲AV无码84| 久久人妻精品国产一区二区三区四区 | 刺青师在线观看韩国电影| 欧美精品久久久久久久久爆乳| 99riAV无码国产在线看不卡| 欧美成人激情视频| 欧美三级精品电影高清| 中文字幕耻辱の奴隷堕落淑女| 欧美人禽动交ZOZ0Zzo| 干柴烈火肉欲李淑芬|