正則運算式定義

??又稱為規則運算式，是一個特殊的字符序列，利用事先定義好的一些特定字符以及它們的組合組成一個‘規則’，檢查一個字串是否與這種規則匹配來實作對字符的檢索、過濾、匹配、替換，正則運算式需要用到re模塊，該模塊不是獨立的第三方庫，不需要單獨安裝，但是使用時必須預先匯入，re模塊提供了正則運算式操作所需的所有功能，

努力路上與你同行！

- - 正則運算式定義
1. `.`:表示除換行符以外的任意一個字符；`\S`: 表示除空白符以外的任意一個字符
2. `[]`:指定字符集
3. `^`:匹配行首，匹配以^后面的字符開頭的字串
4. `$`:匹配行尾，匹配以$之前的字符結束的字串
5. `\`:反斜杠后面可以加不同的字符以表示不同的特殊意義
6. `*`：匹配位于*之前的字符或子模式的0次或多次出現
7. `+`：匹配位于+之前的字符或子模式的1次或多次出現
8. `？`：匹配位于？之前的0個或1個字符
9.`{m,n}`：表示至少有m個重復，至多有n個重復，m和n均為十進制數，
例題
- 例一
- 例二
- 例三
- 例四

https://blog.csdn.net/hanhanwanghaha寶藏女孩的成長日記歡迎您的關注！
歡迎關注微信公眾號：寶藏女孩的成長日記
讓這個可愛的寶藏女孩在努力的道路上與你一起同行！
如有轉載，請注明出處（如不注明，盜者必究）

元字符：在構建正則運算式時，有些特殊字符和自身并不匹配，而是用來表明應和一些特殊的東西匹配，或者會影響重復次數，這些特殊字符稱為元字符，

注: re模塊中的findall方法以串列的形式回傳所有能匹配的子串，如果沒有找到匹配的，則回傳空串列，

常用的元字符，

1. `.`:表示除換行符以外的任意一個字符；`\S`: 表示除空白符以外的任意一個字符

import re
s = 'Hello,i am a college student.My name is Wang Tiantian.h\nb'
print(s)
print(re.findall(r'a',s))      #使用re.findall()方法回傳所有能夠匹配出的子串
print(re.findall(r'n..',s))
print(re.findall(r'm\S',s))

運行結果:
在這里插入圖片描述

2. `[]`:指定字符集

（1）常用來指定一個字符集，如[abc],[a-z],[0-9]；
（2）元字符在中括號中不起作用，如[akm\S]、[m.]中的元字符都不起作用；
（3）中括號內的‘^{’表示補集，匹配不在區間范圍內的字符，如[}3]表示除3以外的任意字符，

import re
s = 'x5x2x0x13xx1x4xxyz'
print(re.findall(r'x[0-9]',s))
print(re.findall(r'x[0-9]x',s))
print(re.findall(r'x[0-9][0-9]x',s))
print(re.findall(r'x[^3]',s))

運行結果:

在這里插入圖片描述

3. `^`:匹配行首，匹配以^后面的字符開頭的字串

import re
s = 'how world How are you How many students'
print(re.findall(r'^h[o].',s))

運行結果：
在這里插入圖片描述

4. `$`:匹配行尾，匹配以$之前的字符結束的字串

import re
s = 'hello,I am wang! so I love you'
print(re.findall(r'you$',s))
print(re.findall(r'hello$',s))

b = 'sdma jdksmi djskjd masdmw'
# $在[]中作為普通字符
print(re.findall(r'm[aiw$]',b))
# 匹配ma,mi,mw結尾的字串
print(re.findall(r'm[aiw]$',b))
# 匹配ma,mi,mw,m$結尾的字串
print(re.findall(r'm[aiw$]$',b))

運行結果：
在這里插入圖片描述

5. `\`:反斜杠后面可以加不同的字符以表示不同的特殊意義

（1）\b匹配單詞頭或單詞尾；
（2）\B與\b相反，匹配非單詞頭或單詞尾；
（3）\d匹配任何十進制數；相當于[0-9]；
（4）\D與\d相反，匹配任何非數字字符，相當于[^0-9]；
（5）\s匹配任何空白字符，相當于[\t\n\r\f\v]；
（6）\S與\s相反，匹配任何非空白字符，相當于[^\t\n\r\f\v]；
（7）\w匹配任何字母、數字或下畫線字符，相當于[a-zA-Z0-9_]；
（8）\W與\w相反，匹配任何非字母、數字和下畫線字符，相當于[^a-zA-Z0-9_]；
（9）也可以用于取消所有的元字符：\、[；
（10）這些特殊字符都可以包含在[]中，如：[\s,.]將匹配任何空白字符、",“或”."，

import re
s = '0x12x3x567x8x49y'
print(re.findall(r'[0-9]',s))
print(re.findall(r'\d',s))
# 匹配字母x或者數字
print(re.findall(r'x\d',s))
print(re.findall(r'[x\d]',s))

運行結果：

在這里插入圖片描述

6. ``：匹配位于之前的字符或子模式的0次或多次出現

import re
s = 'a ab abb abbbbb abbbbbxa'
re.findall(r'ab*',s)

運行結果：
在這里插入圖片描述

7. `+`：匹配位于+之前的字符或子模式的1次或多次出現

import re
s = 'a ab abb abbbbb abbbbbxa'
print(re.findall(r'ab*',s))
print(re.findall(r'ab+',s))

運行結果：
在這里插入圖片描述

8. `？`：匹配位于？之前的0個或1個字符

當“?”緊隨其他限定符（*、+、{n}、{n,}、{n,m}）之后時，匹配模式是“非貪心的”，“非貪心的”模式匹配搜索到盡可能短的字串，而默認的“貪心的”模式匹配搜索到的、盡可能長的字串，

import re
s = 'a ab abb abbbbb abbbbbxa'
print(re.findall(r'ab+',s))     #+符號后沒有問號：默認的貪心模式（盡可能長）
print(re.findall(r'ab+?',s))    #+符號跟問號：非貪心模式（盡可能短）

運行結果：
在這里插入圖片描述

9.`{m,n}`：表示至少有m個重復，至多有n個重復，m和n均為十進制數，

忽略m表示0個重復，忽略n表示無窮多個重復，
{0,}等同于*；{1,}等同于"+"；{0,1}與"?"相同，但是最好使用后者，

import re
s = 'a b baaaabaacccaa '
print(re.findall(r'a{1,3}',s))
print(re.findall(r'a+',s))
print(re.findall(r'a{1,}',s))
print(re.findall(r'a{,3}',s))
print(re.findall(r'a{3}',s))
s = '021 - 33507yyz,021 - 33507865,010 - 12345678,021 - 123456789'
print(re.findall(r'021 - \d{8}',s))
# \b匹配字串的頭和尾
print(re.findall(r'\b021 - \d{8}\b',s))

運行結果：

在這里插入圖片描述

例題

例一

隨機產生10個長度為1-25之間，由字母、數字、下劃線、‘.’、‘#’、‘%’特殊字符組成的字串構成串列，
找出串列中符合下列要求的字串：長度為5～20，必須以字母開頭，可帶數字、下劃線、‘.’，

import string
import random
import re
List1 = []
 #生成包含大小寫字母、數字和其他指定字符的字串
x = string.ascii_letters+string.digits+'_.#%'
#生成串列List1
for i in range(10):
    #生成字符作為元素，個數為1~25亂數之間的字串列y
    y = [random.choice(x) for i in range(random.randint(1,25))]
    #用join方法將y中的元素合并成字串，并將其加入串列List1中
    List1.append(''.join(y))
#輸出串列List1
print('生成的串列為：')
for s in List1:
    print(s)
print()

# 查找符合要求的字串：
#(1)總長度為5~20
#(2)以字母開頭（1個字符）：^[a-zA-Z]{1}
#(3)可帶數字、下劃線、'.'，至尾部共4~19個：[a-zA-Z0-9._]{4,19}$
#構建正則運算式
r = r'^[a-zA-Z]{1}[a-zA-Z0-9._]{4,19}$'
print('滿足要求的字串是：')
for i in List1:
    if re.findall(r,i):
        print(i)

運行結果:
在這里插入圖片描述

例二

撰寫程式，生成一個包含十個不重復的取自a～z（隨機生成）的小寫字母的串列，將原串列中‘abcdefg’字母字符按位置順序分別替換為‘1234567’數字字符，即a替換為1，b替換為2，以此類推，先輸出原串列和新串列，再采用字串格式化方式逐個輸出新串列中的元素，

# coding=utf-8

"""
撰寫程式，生成一個包含十個不重復的取自a～z（隨機生成）的小寫字母的串列，
將原串列中‘abcdefg’字母字符按位置順序分別替換為‘1234567’數字字符，即a替換為1，b替換為2，
以此類推，先輸出原串列和新串列，再采用字串格式化方式逐個輸出新串列中的元素，
"""

import random

list1 = []
i = 0
while i < 10:
    c = chr(random.randint(ord('a'), ord('z')))
    if c not in list1:
        i += 1
        list1.append(c)
print('原串列：', list1)
s1 = ','.join(list1)

#通過maketrans和translate函式實作字符的替換
t = ''.maketrans("abcdefg", '1234567')
s2 = s1.translate(t)
list2 = s2.split(',')
print("新串列", list2)
print("逐個輸出新串列中的元素：")
for i in list2:
    print("%s" % i, end='')

運行結果：
在這里插入圖片描述

例三

生成15個包括10個字符的隨機密碼，密碼中的字符只能是大小寫字母、數字和特殊字符“@”、“$”、“#”、“&”、“_”、“~”構成，

# coding=utf-8

"""
生成15個包括10個字符的隨機密碼，
密碼中的字符只能是大小寫字母、
數字和特殊字符“@”、“$”、“#”、“&”、“_”、“~”構成，
"""

import string
import random

password1 = string.ascii_letters + string.digits + "@$#&_~"
for i in range(15):
    print("隨機密碼" + str(i + 1) + ":", end=" ")
    password2 = "".join([random.choice(password1) for i in range(10)])
    print(password2, end=" ")
    print()

在這里插入圖片描述

https://blog.csdn.net/hanhanwanghaha寶藏女孩的成長日記歡迎您的關注！
歡迎關注微信公眾號：寶藏女孩的成長日記
讓這個可愛的寶藏女孩在努力的道路上與你一起同行！
如有轉載，請注明出處（如不注明，盜者必究）

例四

# coding=utf-8

"""
給定串列x=["13915556234", "13025621456", "15325645124", "15202362459"]，
檢查串列中的元素是否為移動手機號碼，這里移動手機號碼的規則是：手機號碼共11位數字；
以13開頭，后面跟4、5、6、7、8、9中的某一個；或者以15開頭，后面跟0、1、2、8、9中的某一個，
"""

import re

x = ["13915556234", "13025621456", "15325645124", "15202362459"]

zz = r'^(13[4-9]\d{8})|(15[01289\d{8}])$'
print("列印所有號碼：", x)

print("其中，為移動手機號碼的為：")
for i in x:
    if re.findall(zz, i):
        print(i)

運行結果：
在這里插入圖片描述
近日新感悟：如果遇到不是很確定是否要解決阻礙，那不妨退一萬步，用最初的目標來衡量這件事是否值得，或者以客觀的態度來衡量此事！

接下來這一年得好好努力了，希望明年的這個時候我已上岸！也祝所有考研的小伙伴一起努力，最后能夠去到想去的大學！
在這里插入圖片描述

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/278871.html

標籤：python

上一篇：Python異步并發機制詳解，讓你的代碼運行效率就像搭上了火箭！！！

下一篇：【python零基礎爬蟲入門】，爬取百度圖片，小孩子也能學會

學習python 正則運算式——與你同行！

正則運算式定義

努力路上與你同行！

1. .:表示除換行符以外的任意一個字符；\S: 表示除空白符以外的任意一個字符

2. []:指定字符集

3. ^:匹配行首，匹配以^后面的字符開頭的字串

4. $:匹配行尾，匹配以$之前的字符結束的字串

5. \:反斜杠后面可以加不同的字符以表示不同的特殊意義

6. *：匹配位于*之前的字符或子模式的0次或多次出現

7. +：匹配位于+之前的字符或子模式的1次或多次出現

8. ？：匹配位于？之前的0個或1個字符

9.{m,n}：表示至少有m個重復，至多有n個重復，m和n均為十進制數，

例題

例一

例二

例三

例四

1. `.`:表示除換行符以外的任意一個字符；`\S`: 表示除空白符以外的任意一個字符

2. `[]`:指定字符集

3. `^`:匹配行首，匹配以^后面的字符開頭的字串

4. `$`:匹配行尾，匹配以$之前的字符結束的字串

5. `\`:反斜杠后面可以加不同的字符以表示不同的特殊意義

6. ``：匹配位于之前的字符或子模式的0次或多次出現

7. `+`：匹配位于+之前的字符或子模式的1次或多次出現

8. `？`：匹配位于？之前的0個或1個字符

9.`{m,n}`：表示至少有m個重復，至多有n個重復，m和n均為十進制數，