正則小練習:匹配出以下字串所有url,
import re
def find_url(sentence, show_urls=None, delete_urls=None):
r = re.compile(
r'(?i)\b((?:[a-z][\w-]+:(?:/{1,3}|[a-z0-9%])|www\d{0,3}[.]|[a-z0-9.\-]+[.][a-z]{2,4}/)(?:[^\s()<>]+|\(([^\s()<>]+|(\([^\s()<>]+\)))*\))+(?:\(([^\s()<>]+|(\([^\s()<>]+\)))*\)|[^\s`!()\[\]{};:\'".,<>???“”‘’]))')
url_list = r.findall(sentence)
if show_urls == 1:
for i in url_list:
print(i[0])
if delete_urls == 1:
for j in url_list:
# sentence = sentence.replace(j[0], '<URL>')
sentence = sentence.replace(j[0], '')
return sentence
return "匹配完成"
if __name__ == '__main__':
str1 = '你好哇 大佬 www.google.com'
str2 = '哇 www.baidu.com 打不開了'
str3 = 'python網址在哪兒 https://www.python.com 找到了'

對于字串的基礎使用基本已經闡述完畢!需要復雜使用的還需專案實戰以及向大佬們請教,后面的幾篇文章還是想闡述關于資料結構的一些基礎使用,字串可以看作為只存盤字符序列的資料結構,同樣為了方便眾多使用者的理念,Python提供了幾個功能強大且高效的資料結構:串列、元組、字典以及集合,作為使用者的我們只需要組合使用即可,
在開始資料結構使用前,需要介紹一個Python的另一個內置函式:type(),該函式在我們需要了解值或變數的資料型別時極為方便,如下:type輸出結果中包含class 類,可以回傳特定值和變數或者是否為模塊函式,在代碼除錯程序中,該函式會起到很大的作用,例如在使用資料集合但并不知集合內部的資料型別時,可以使用type準確的回傳物件型別,

本文重點內容主要是對串列資料結構的使用
1 序列
在Python中,序列是一組按順序排列的值,Python 有 3 種內置的序列型別:字串、 元組和串列, 序列支持切片、索引,同時具備以下特征:
1 第一個正索引為零,指向左端;
2 第一個負索引為 -1,指向右端;
3 可使用切片表示法來復制子序列;
4 可使用 + 和 * 進行拼接;
5 可使用函式 len 計算其長度,例如,len(string) 回傳序列 string 包含的元素數;
6 運算式 x in string 檢查序列 string 是否包含元素 x ,
2 串列
在Python中,串列的元素不是固定不變的,而是可變的,也就是表示可在不復制的情況下,添加、洗掉或修改串列元素,串列使用方括號將元素括起來,里面的元素使用逗號分開,舉幾個簡單示例:隨便定義一個num串列,可以使用+和*拼接串列,也可以使用len()獲取串列長度,并且,同樣可以使用切片和索引方式來獲取串列中的子串列,

需要注意的是:串列可包含任何型別的值:數字、字串甚至其他序列,空串列用 [] 表示,而只包含一個元素(x)的單元素串列寫做 [x] ,其訪問方式與字串的索引方式一樣,以num2為例,如下圖:串列索引從 0 開始,第二個索引是 1,依此類推,當然也可以從右向左進行索引,

除了以上索引功能,串列也支持修改元素的功能,如下圖我們將num2中的indexes=3的值777改為了'red'字串,Python對原值進行了洗掉,

這里可以得到一個結論:串列元素指向相應的值,這也產生了一個十分有趣的作用,這里讓一個串列元素指向串列本身,創建了一個自參考的資料結構;列印輸出中的 [...] 表明,Python可以識別自參考,不會愚蠢的不斷列印串列(功能強大!) ,

本文首發公眾號:滌生手記大資料:更多資源,更便捷,瀏覽交流,更多免費職業規劃,請關注哦,
2.1 串列函式
Python針對串列也提供了十分強大的函式,整理如下表所示:除count回傳值只回傳一個數字之外,其他所有函式都涉及到修改傳遞給它們的串列,使用時一定小心,不然會誤刪串列中的元素或者在錯誤的位置插入元素,
| 函式名 | 回傳值 |
| num.append(n) | 在串列 num 末尾添加元素 n |
| num.count(n) | 回傳元素 n 在串列 num 中出現的次數 |
| num.extend(lnumt) | 將 lnumt 的所有元素都添加到串列 num末尾 |
| num.indexnajiu (n) | 回傳第一個 n 元素的索引 |
| num.innumert(i, n) | 將元素 n 插入到索引 i 指定的元素前面,結果是 num[i] == n |
| num.pop(i) | 洗掉并回傳 num 中索引為 i 的元素 |
| num.remove(n) | 洗掉 num 中的第一個 n 元素 |
| num.revernume() | 反轉 num 中元素的排列順序 |
| num.numort() | 將 num 的元素按升序排列 |
以函式append為例,在串列num末尾添加一個元素,簡單的一種編程模式,在函式開頭創建一個空串列,然后再串列中添加元素,如下:判斷一個串列中的資料是正數還是負數,
def list_num(list):
msg = []
for num in list:
if num < 0:
s = str(num) + ' 是負數'
elif 0 <= num <= 9:
s = str(num) + ' 是正數'
msg.append(s)
return msg
if __name__ == '__main__':
print(list_num([3,-10.7,22,-99,1]))

extend串列追加函式的使用:

pop洗掉函式的使用:

其它相關函式的使用就不一一舉例了,有興趣的可以自己體驗一下,
2.2 串列排序
對資料進行排序是計算機最常做的事情 之一,無論是對人還是計算機來說,排序后 的資料通常比未排序的資料更容易處理,例如,在串列中查找最小的元素時,如果串列經過了排序,就根本不需要查找:第一個元素就是,人們的習慣就是喜歡排列有序的資料(特例除外哈),
在 Python 中,要對串列進行排序,最簡 單的方式是使用函式 sort(),實際上,這個函式可用于對包含數萬個元素的串列進行快速排序,同時可以修改串列,如下:sort總是按照從小到大的順序排序,若需要相反的順序排列元素,先呼叫sort方法之后在使用reverse方法,


Python還可以給包含元組(將在下次講解)的串列進行排序,如下:給串列中的元組排序時,首先按元組的 第一個元素排序,如果第一個元素相同,則按第二個元素排序,依此類推,

2.3 決議串列
在實際Python使用中,會有很多地方使用到串列,所以Python提供了一種用于創建串列的特殊表示法—串列決議,下面舉例如何使用串列決議來創建 一個由 1~10 的平方組成的串列: 這種表示法的主要優點是簡潔易讀,for回圈代碼沒有使用串列決議,使用越多就越會發現,串列決議方法撰寫容易并且簡潔,
if __name__ == '__main__':
print([num * num for num in range(1,11)])
print('------------------')
num_list = []
for i in range(1, 11):
num_list.append(i * i)
print(num_list)

在看3個小例子:第一個表示獲取1~10的立方,第二個表示修改現有串列的字串,第三個表示將串列中的數字翻倍并減去3.

使用串列決議過濾篩選需要的結果集,如下:

list = []
num = [-1, 0, 6, -4, -2, 3, 8, -12]
for n in num:
if n > 0:
list.append(n)
對比使用常規回圈,可以體現出串列決議更加簡潔易讀!其它還可以實作諸如洗掉特定字串的功能,有興趣的朋友們可以實作一下洗掉特定字串的串列決議,十分簡單,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/393927.html
標籤:其他
