模式符 | 描述 |
---|---|
s(單行) | 如果設置了這個修飾符, 模式中的點號元字符匹配所有字符, 包含換行符. 如果沒有這個 修飾符, 點號不匹配換行符 |
m(多行) | 目標字符串是由單行字符組成的(然而實際上它可能會包含多行), “行首”元字符(^)僅匹配字符串的開始位置, 而”行末”元字符($)僅匹配字符串末尾。當這個修飾符設置之后, “行首”和”行末”就會匹配目標字符串中任意換行符(\n)之前或之后 |
通過上面說明,其實這2個修飾符都只是,修改正則表達式常見元字符的匹配范圍了。如果加”s”修飾符,元字符”.” 將能夠匹配換行符(\n),如果加”m”修飾符,元字符”$”,將只匹配到”\n”字符前;元字符”^”,將匹配到”\n”字符后。我們還是舉例說明吧!(下面關于正則表達式?字符,可以看看前面一節:正則表達式(regex) 貪婪模式、懶惰模式使用)
舉例,看單行應用
?php ///讀取hao123.com首頁 ///并且去掉里面script代碼 /** *去掉script標簽* * @author chengmo * @copyright http://blog.chacuo.net/ * @param string $content 原字符串 * @param int $style 匹配模式 * @return string */ function remove_script($content,$style=1) { $reg = $style == 1?"%script.*?>.*?/script>%":"%script.*?>.*?/script>%s"; return preg_replace($reg,"",$content); } $content = file_get_contents('http://www.hao123.com'); echo remove_script($content);
舉例,看多行應用
?php ///讀取hao123.com首頁 ///讀取meta標簽內容 /** *讀取meta標簽內容* * @author chengmo * @copyright http://blog.chacuo.net/ * @param string $content 原字符串 * @param int $style 匹配模式 * @return string */ function read_meta($content,$style=1) { $reg = $style == 1?"%^meta.*?/>%":"%^meta.*?>\s+$%m"; preg_match_all($reg,$content,$arr); return $arr; } $content = file_get_contents('http://www.hao123.com'); var_dump(read_meta($content));
后記:s,m 修飾符只對,幾個特殊元字符有改變。如果你正則表達式中沒有那幾個元字符。開啟s,m字符前后將沒有什么變化的。對于上面讀取hao123.com代碼,我們可以繼續同時使用s,m模式。如:”%script.*?>.*?(^currentProfile.*$).*?/script>%sm” ,匹配所有script標簽,并且里面js代碼,有一行以curentProfile開頭字符串。(以下是正則表達式,單行多行一起使用)