好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

主頁 > 知識庫 > 正則基礎(chǔ)之 \b 單詞邊界

正則基礎(chǔ)之 \b 單詞邊界

熱門標簽:錫林郭勒盟地圖標注位置 電銷機器人公司簡介 RO地圖標注app 湖南企業(yè)智能外呼系統(tǒng)供應(yīng)商 高德地圖標注短信簽約 知名的電話機器人 百音電話機器人 福州工作銷售電話機器人 自制電銷機器人
1概述
“\b”匹配單詞邊界,不匹配任何字符。
“\b”匹配的只是一個位置,這個位置的一側(cè)是構(gòu)成單詞的字符,另一側(cè)為非單詞字符、字符串的開始或結(jié)束位置。“\b”是零寬度的。
基本上所有的資料里都會說“\b”是單詞邊界,但是關(guān)于“單詞”的范圍卻是少有提及。通常情況下,正則表達式中所謂的“單詞”,就是由“\w”所定義的字符所組成的子串。
“\b”表示所在位置的一側(cè)為單詞字符,另一側(cè)為非單詞字符、字符串的開始或結(jié)束位置,也就相當(dāng)于
(?!\w)(?=\w)|(?=\w)(?!\w)
思考:以下寫法為什么不等價于“\b”
(?=\W)(?=\w)|(?=\w)(?=\W)
2\w的范圍
即然涉及到“\w”,那就要先考察一下它的范圍。
在支持ASCII碼的語言中,如JavaScript,“\w”等價于[a-zA-Z0-9_] ;
在支持Unicode的語言中,如.NET,默認情況下,“\w”除可以匹配[a-zA-Z0-9_]外,還可以匹配一些Unicode字符集,如漢字,全角數(shù)字等等。
幾乎所有常見的語言都遵循這樣一個規(guī)律,只有Java是個例外。在Java中,“\w”的表現(xiàn)是比較奇怪的,Java是支持Unicode的,但Java的正則中的“\w”卻是等價于[a-zA-Z0-9_]的。
先來看一下“\w”在幾種語言中匹配的例子
JavaScript
復(fù)制代碼 代碼如下:

script language="javascript">
var str = "abc_123中文_d3=efg漢字%";
var reg = /\w+/g;
var arr = str.match(reg);
if(arr != null)
{
for(var i=0;iarr.length;i++)
{
document.write(arr[i] + "br />");
}
}
/script>
//JavaScript中輸出
abc_123
_d3
efg

C#
復(fù)制代碼 代碼如下:

string test = "abc_123中文_d3=efg漢字%";
MatchCollection mc = Regex.Matches(test, @"\w+");
foreach (Match m in mc)
{
richTextBox2.Text += m.Value + "\n";
}
//C#中輸出
abc_123中文_d3
efg漢字

Java
復(fù)制代碼 代碼如下:

String test = "abc_123中文_d3=efg漢字%";
String reg = "\\w+";
Matcher m = Pattern.compile(reg).matcher(test);
while(m.find())
{
System.out.println(m.group());
}
//Java中輸出
abc_123
_d3
efg

可以看到,“\w”在Java中的輸出和JavaScript中是一樣的,都是只支持ASCII字符。
3 \b的范圍
常見語言中“\w”的范圍確定了,那么是不是可以認為“\b”的匹配范圍與“\w”也是一致的呢?
再看下下面的例子:
源字符串:abc_123中文_d3=漢字efg
正則表達式:.\b.
JavaScript
復(fù)制代碼 代碼如下:

script language="javascript">
var str = "abc_123中文_d3=efg漢字%";
var reg = /.\b./g;
var arr = str.match(reg);
if(arr != null)
{
for(var i=0;iarr.length;i++)
{
document.write(arr[i] + "br />");
}
}
/script>
//JavaScript中輸出
3中
文_
3=
g漢

C#
復(fù)制代碼 代碼如下:

string test = "abc_123中文_d3=efg漢字%";
MatchCollection mc = Regex.Matches(test, @".\b.");
foreach (Match m in mc)
{
richTextBox2.Text += m.Value + "\n";
}
//C#中輸出
3=
字%

Java
復(fù)制代碼 代碼如下:

String test = "abc_123中文_d3=efg漢字%";
String reg = ".\\b.";
Matcher m = Pattern.compile(reg).matcher(test);
while(m.find())
{
System.out.println(m.group());
}
//Java中輸出
3=
字%

可以看到,Java的輸出和.NET是一致的,“\b”在Java中是支持Unicode的。
所以總的來說,Java中的“\w”是很奇怪的,而“\b”是與其它語言表現(xiàn)一致的,在使用時需要注意。
4 \b應(yīng)用場景
4.1 基礎(chǔ)應(yīng)用
“\b”一般應(yīng)用在需要匹配某一單詞字符組成的子串,但這一字符不能包含在同樣由單詞字符組成的更長的子串中。
比如要替換掉一段英文中的單詞“to”,而“today”顯然不在替換的范圍內(nèi),所以正則可以用“\bto\b”來限定。
用得比較多的場景是在HTML標簽的匹配中,用以區(qū)分相互包含的標簽,比如要過濾掉b>、/b>、p…>、img…>等標簽,但要保留br />標簽,正則可以寫成“(/?b|p|img)\b[^>]*>”。
舉例:統(tǒng)計以“,”分割的元素中“3”的個數(shù)
string test = "137,1,33,4,3,6,21,3,35,93,2,98";
int count = Regex.Matches(test, @"\b3\b").Count; //結(jié)果:2
4.2 進階應(yīng)用
稍復(fù)雜一些的應(yīng)用通常都是與其它一些正則語法規(guī)則一起使用的,參考一個帖子
求一正則表達式
4.3 特殊情況
“\b”用在正則中,通常情況下都是表示單詞邊界的,只有在字符組中,它表示的是退格鍵,即
[a-z\b]
此處的“\b”表示的是退格鍵,而不是單詞邊界。

標簽:秦皇島 玉林 怒江 河北 吉林 茂名 西寧 昆明

巨人網(wǎng)絡(luò)通訊聲明:本文標題《正則基礎(chǔ)之 \b 單詞邊界》,本文關(guān)鍵詞  正則,基礎(chǔ),之,單詞,邊界,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《正則基礎(chǔ)之 \b 單詞邊界》相關(guān)的同類信息!
  • 本頁收集關(guān)于正則基礎(chǔ)之 \b 單詞邊界的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    主站蜘蛛池模板: 8×8x永久海外华人免费| 聊斋艳谭7| 厕所撒尿ass性老妇| gif动图哔哩哔哩| 欧洲老妇bbbbbxxxxx| 新婚夫妇做爰无码A片| 福利在线一区二区| 免费看啪啪人A片AAA片| 国产精品视频永久免费观看 | 亚洲变态另类一区二区三区| 亚洲一区二区三区四区五区六| 青柠在线直播大全免费观看| 亚洲AV无码乱码精品国产| 男女大尺度打野战视频| 男女性生活片| 麻豆??视频在线观看免费网站黄 | 边走楼梯边做嗯好爽| 87亚洲AV无码乱码精品观看| 欲梦AI换脸污污污| 精品久久久久久中文字幕一区奶水| 色屋| 翁熄性荡事最新篇王伟忠| 我一叫床他就越用力| 扒开腿挺进嫩苞处破苞疼合集| 欧美人与禽动交精品免费视频| 久久久久精品之久精品48| 免费一级淫片aa| 抱着娇妻让粗大玩3p| 免费午夜在线视频| 2019亚洲男人天堂| 熟女人妻久久久一区二区蜜桃老牛 | 少萝自愿裸体???漫画| 国产精品国产主播在线观看| 免费看视频app| 潘金莲高清dvd碟片| 西西人体扒开大胆大尺度展露| 美女三级福利视频| 女老丝袜脚摩擦阳茎视频| 强制爱(巨肉高H)| mm131美女久久精品美女图片| 美女老师被艹|