好湿?好紧?好多水好爽自慰,久久久噜久噜久久综合,成人做爰A片免费看黄冈,机机对机机30分钟无遮挡

主頁 > 知識庫 > 如何使用python提取字符串的中英文(正則判斷)

如何使用python提取字符串的中英文(正則判斷)

熱門標簽:唐山智能外呼系統一般多少錢 哈爾濱ai外呼系統定制 廣告地圖標注app 激戰2地圖標注 公司電話機器人 陜西金融外呼系統 白銀外呼系統 海南400電話如何申請 騰訊外呼線路

前言

提取中英文是我們在做數據處理時候經常使用的,最高效的做法就是通過正則判斷了,下面是我寫的筆記,希望對你有用

一. re中的sub函數

使用Python 的re模塊,re模塊提供了re.sub用于替換字符串中的匹配項。

re.sub(pattern, repl, string, count=0)

參數說明:

  • pattern:正則重的模式字符串
  • repl:被拿來替換的字符串
  • string:要被用于替換的原始字符串
  • count:模式匹配后替換的最大次數,省略則默認為0,表示替換所有的匹配

1.1 提取中文

可以這樣想:我們可以通過將不是中文的字符替換為空不就可以了

例如

import re
str = "重出江湖hello的地H方。。的,world"
str = re.sub("[A-Za-z0-9\,\。]", "", str)
print(str)
輸出:神的孩子在唱歌

1.2 提取英文

import re
str = "重123出江湖hello的地H方。。的,world"
str = re.sub("[\u4e00-\u9fa5\0-9\,\。]", "", str)
print(str)
輸出:helloHworld

1.3 提取數字

import re
str = "重123出江湖hello的地H方。。的,world"
str = re.sub("[A-Za-z\u4e00-\u9fa5\,\。]", "", str)
print(str)
輸出:123

二. re中的findall函數

在字符串中找到正則表達式所匹配的所有子串,并返回一個列表,如果沒有找到匹配的,則返回空列表。

語法格式為:

findall(string[, pos[, endpos]])

參數:

  • string : 待匹配的字符串。
  • pos : 可選參數,指定字符串的起始位置,默認為 0。
  • endpos :可選參數,指定字符串的結束位置,默認為字符串的長度。 查找字符串中的所有數字:

擴展:正則中有match 和 search ,它們是是匹配一次,findall

匹配所有,具體了解可以到菜鳥教程查看

2.1 提取中文

2.2 提取英文

通俗寫法

import string#提供a-z的小寫字母
dd = "神的孩子hello在H唱歌,world"
#準備英文字符
temp=""
letters=string.ascii_lowercase#包含a-z的小寫字母
for word in dd:#for循環取出單個詞
    if word.lower() in letters:#判斷是否是英文
        temp+=word#添加組成英文單詞
print(temp)
輸出:helloHworld

正則

#A-Za-z
import re
dd = "重出123江湖hello的地方的,world"
result = ''.join(re.findall(r'[A-Za-z]', dd)) 
print(result)
輸出:helloHworld

2.3 提取數字

#0-9注意這個數字前面不能\,要不然他連,都給算上
import re
dd = "神123的孩子hello在唱H歌。。,world"
result = ''.join(re.findall(r'[0-9]', dd)) 
print(result)
輸出:123

三. re中的compile函數

compile函數用于編譯正則表達式,生成一個正則表達式( Pattern )對象,供其他函數使用。

語法格式為:

re.compile(pattern[, flags])

參數:

pattern : 一個字符串形式的正則表達式

flags : 可選,表示匹配模式,比如忽略大小寫,多行模式等,具體參數為:

  • re.I 忽略大小寫
  • re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依賴于當前環境
  • re.M 多行模式
  • re.S即為 . 并且包括換行符在內的任意字符(. 不包括換行符)
  • re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s,\S 依賴于 Unicode 字符屬性數據庫
  • re.X 為了增加可讀性,忽略空格和 # 后面的注釋

3.1 同時匹配中英文數字去除其他字符

總結

到此這篇關于如何使用python提取字符串中英文的文章就介紹到這了,更多相關python提取字符串中英文內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python字符串的多行輸出的實例詳解
  • python列表和字符串的三種逆序遍歷操作
  • python 如何比較字符串是否一樣
  • python str()如何將參數轉換為字符串類型
  • 教你怎么用python實現字符串轉日期
  • 詳解python字符串駐留技術
  • python 如何將帶小數的浮點型字符串轉換為整數
  • Python的字符串示例講解
  • python生成隨機數、隨機字符、隨機字符串的方法示例
  • python如何正確的操作字符串

標簽:惠州 黔西 常德 黑龍江 四川 益陽 鷹潭 上海

巨人網絡通訊聲明:本文標題《如何使用python提取字符串的中英文(正則判斷)》,本文關鍵詞  如何,使用,python,提取,字符串,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《如何使用python提取字符串的中英文(正則判斷)》相關的同類信息!
  • 本頁收集關于如何使用python提取字符串的中英文(正則判斷)的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 成人一区二区丝袜美腿| 大学情侣酒店啪啪又大又粗| 伦理年轻漂亮的岳?9| 久久久久久毛片免费播放| 双男免费观看gay动漫| Free HD Cartoon XXX Videos| 午夜福利理论片在线观看| 中文字幕一区二区三区久久网站| 免费无码又爽又刺激高潮九一视频 | 一级毛片aaa| 天天干天天干天天操| 色综合久久久无码中文字幕波多 | 快猫旧版入口直接进入| 老A影视在线一区二区| 穿裙子被同桌摸出水好爽| 怎么把衣服p光| 欧美一级婬片AAAA毛片不忠| 国精产品一区二区三区四季 | 父亲大学宿舍一战六个人| yw193.c国产在线观看| 国产一级黄| 日本wwwsss| 天天操夜夜做| 爱搞搞就要干| 恶人报喜国语完整版在线观看| 国产偷啪视频一区| 韩国AV?无码?高潮?红桃小说| 好看的视频福利视频| 出差被夫の上司持久侵电影| 男人摸女人胸| 女人操男人| 成人网址| 一级做a爱片特黄在线观看免费看 翁公和在厨房猛烈进出 | yin荡体育生双龙+互攻动漫| 亚洲第一成人影院| 用力操啊| 猛的从她身后挺进去| 欧美国产精品一区二区不卡| 浪荡受宿舍猛c太深了男男| 看污软件| 腿张大点就能吃扇贝肉|