1. 封裝和解構
- 1.1 封裝
- 1.2 解構
2. 集合Set
- 2.1 初始化
- 2.2 增加
- 2.3 洗掉
- 2.4 遍歷
- 2.5 并集&交集&差集&對稱差集
3.字典
- 3.1 初始化
- 3.2 增刪改查
- 3.3 遍歷
4.決議式和生成器運算式
- 4.1 串列決議式
- 4.2 生成器運算式
- 4.3 集合決議式
- 4.4 字典決議式

哈嘍，大家好！距離上一篇文章近1個半月了，不是我拖呀~，剛好這個月遇到了作業調整，再加上要照顧10個月的孩子，實屬不易，所以就這么長時間沒來更新了，這不，我每天碼一點點，'滴水成河'，努力完成了這篇文章，

1. 封裝和解構

1.1 封裝

說明： 等號(=)右邊有多個數值僅通過逗號分割，就會封裝到一個元組，稱為封裝packing，

# 示例：
x = 1,
y = 1,2
print(type(x), x)
print(type(y), y)

# 輸出結果如下：
<class 'tuple'> (1,)
<class 'tuple'> (1, 2)

備注： 如果右邊只有一個數值且沒有用逗號，其實是一個整數型別，請留意，另外等號右邊一定先運行，再賦值給左邊，

1.2 解構

說明： 等號(=)右邊容器型別的元素與左邊通過逗號分割的變數要一一對應，稱為解構unpacking，

x,y = (1,2)  # [1,2] {1,2} {'a':1,'b':2}
print(x)
print(y)

# 輸出結果如下：
1
2

備注：右邊的容器可以是元組、串列、字典、集合等，必須是可迭代物件，

錯誤示范：

x,y = (1,2,3)
print(x)
print(y)

# 輸出結果如下：
ValueError: too many values to unpack (expected 2)

說明：左、右兩邊個數一定要一致，不然會拋出'ValueError'錯誤，

剩余變數解構

說明：python3引入了剩余變數解構(rest)，'盡可能'收集剩下的資料組成一個串列，

x, *rest = [1,2,3,4,5,6]
print(type(x), x)
print(type(rest), rest)  # 剩余沒有賦值的就是rest的了

# 輸出結果如下：
<class 'int'> 1
<class 'list'> [2, 3, 4, 5, 6]

*rest, y = [1,2,3,4,5,6]
print(type(rest), rest)
print(type(y), y)

# 輸出結果如下：
<class 'list'> [1, 2, 3, 4, 5]
<class 'int'> 6

錯誤示例：

不能單獨使用

說明：等號左邊只有一個識別符號，無法解構，

*rest = [1,2,3,4,5,6]
print(rest)

# 輸出結果如下：
 #語法錯誤
 SyntaxError: starred assignment target must be in a list or tuple

不能多次同時使用

x, *rest1, *rest2, y = [1,2,3,4,5,6]
print(rest1)
print(rest2)

# 輸出結果如下：
 #語法錯誤，其中一個rest就把剩余元素拿走了，另外一個rest怎么拿？
 SyntaxError: two starred expressions in assignment

另外一種丟棄變數下劃線：'_'

說明： '_'是合法的識別符號，大多場景表示不關心該值，

x, *_, y = [1,2,3,4,5,6]
print(x)
print(_)
print(y)
# 輸出結果如下：
1
[2, 3, 4, 5]
6

_, *rest, _ = [1,2,3,4,5,6]
print(_)  # '_'是上一次輸出值
print(rest)
# 輸出結果如下：
6
[2, 3, 4, 5]

2. 集合Set

說明：集合是'可變的、無序的、不重復'的元素集合，

成為集合元素是有條件的：'元素必須可hash、可迭代'

可哈希物件如下(不可變)：

數值型：int(整數)、float(浮點)、complex(復數)
布爾型：True(是)、False(否)
字串：string(字串)、bytes(位元組)
tuple(元組)
None(空)

可以通過內置hash函式判斷是否可hash：

s1 = [1,2,3]
print(hash(s1))

# 輸出結果如下：
TypeError: unhashable type: 'list'  # 串列是不可hash的

2.1 初始化

說明：

set() -> new empty set object，新的空集合
set(iterable) -> new set object，元素必須可迭代

s = {}  # 注意這個是空字典，不是空集合
s1 = set()  # 空集合
s2 = set([1,2,3])  # 注意串列里面元素迭代出來的是整數，可hash
s3 = set("abcd")
print(s1)
print(s2)
print(s3)

# 輸出結果如下：
set()
{1, 2, 3}
{'c', 'd', 'a', 'b'}

錯誤示例：

s = set([[1]]) # 串列套串列，迭代出來是串列，不可hash
print(s)

# 輸出結果如下：
TypeError: unhashable type: 'list'

2.2 增加

s.add(element)

說明：增加一個元素到集合，如果元素已經存在，則不操作，

s1 = set([1,2,3])
s1.add(4)
print(s1)

# 輸出結果如下：
{1, 2, 3, 4}

s.update(*element))

說明：合并一個或多個元素到集合中，元素必須可迭代(把迭代的元素并到集合)，和后面講的并集一樣，

s1 = set([1,2,3])
s1.update((4,5,6),[7,8,9])
print(s1)

# 輸出結果如下：
{1, 2, 3, 4, 5, 6, 7, 8, 9}

2.3 洗掉

remove(element)

說明：從集合中移除一個元素，如果元素不存在拋出'KeyError'錯誤，
```
s1 = {1,2,3,4,5,6}
s1.remove(6)
print(s1)

# 輸出結果如下：
{1, 2, 3, 4, 5}
```
discard(element)

說明：也是從集合中移除一個元素，如果元素不存在不會報例外，啥都不做，
```
s1 = {1,2,3,4,5,6}
s1.discard(6)
print(s1)

# 輸出結果如下：
{1, 2, 3, 4, 5}
```
pop()

說明：因為集合是無序的，所以是洗掉'任意'一個元素，如果是空集則拋出'KeyError'錯誤，
```
s1 = {1,2,3,4,5,6}
print(s1.pop())  # 隨機的(因為無序)
print(s1)

# 輸出結果如下：
1
{2, 3, 4, 5, 6}
```

clear()

說明：洗掉所有元素，都不推薦使用的啦，

s1 = {1,2,3,4,5,6}
s1.clear()
print(s1)

# 輸出結果如下：
set()

2.4 遍歷

說明：集合是個容器，是可以遍歷的，但是效率都是O(n)，

s1 = {1,2,3}
for s in s1:
    print(s)
# 輸出結果如下：
1
2
3

說到這里，你覺得集合set和串列list哪個遍歷效率更高呢？

答案是set，因為set的元素是hash值作為key(下面講的字典也是hash值)，查詢時間復雜度為O(1)，而list是線性資料結構，時間復雜度是O(n)，

大家可以按照如下進行驗證下，隨著資料規模越來越大，很明顯就可以看出哪個效率高，

2.5 并集&交集&差集&對稱差集

并集

說明： 將多個集合的所有元素合并在一起組成新的集合，
```
s1 = {1,2,3}
s2 = {3,4,5}
print(s1.union(s2))

# 輸出結果如下：
{1, 2, 3, 4, 5}
```
備注：還可以使用運算子 '|'、'update(element)'、'|='，
交集

說明： 取多個集合的共同(相交)元素
```
s1 = {1,2,3}
s2 = {3,4,5}
print(s1.intersection(s2))

# 輸出結果如下：
{3}
```
備注：還可以使用'&'、's.intersection_update(element)'、'&='，
差集

說明：屬于一個集合但不屬于另一個集合的元素組成的集合，
```
s1 = {1,2,3}
s2 = {3,4,5}
print(s1.difference(s2))

# 輸出結果如下：
{1, 2}
```
備注：還可以使用'-'、's.difference_update(element)'、'-='.
對稱差集

說明：多個集合中，不屬于交集元素組成的集合，
```
s1 = {1,2,3}
s2 = {3,4,5}
print(s1.symmetric_difference(s2))

# 輸出結果如下：
{1, 2, 4, 5}
```
備注：還可以使用'^{'、's1.symmetric_difference_update(s2)'、'}='.

3.字典

說明：字典是由任意個item(元素)組成的集合，item是由key:value對組成的二元組，

字典是'可變的'：支持增刪改查；
字典是'無序的'：key存盤是無序的，非線性資料結構(請不要讓表面蒙蔽了你哈)；
字典是'key不重復'：key是唯一的，且必須可'hash'；

3.1 初始化

# 空字典
d1 = {}
d2 = dict()

# 示例：
d3 = dict(a=1,b=2,c=3)
d4 = dict(d3)
d5 = dict([('a',1),('b',2),('c',3)])  # 元素必須是可迭代的
d6 = {'a':1,'b':2,'c':3}

# 輸出結果都是：
{'a': 1, 'b': 2, 'c': 3}

3.2 增刪改查

增加&修改元素

1）通過'd[key] = value'方式：

備注：如果key不存在，則新增，key存在則直接覆寫(修改元素)，

# 增加 & 修改
d = {'a':1,'b':2,'c':3}
d['d'] = 4 # 增加
d['a'] = 11 # 修改
print(d)

# 輸出結果如下：
{'a': 11, 'b': 2, 'c': 3, 'd': 4}

2）通過d.update([E, ]**F) -> None

# 增加 & 修改
d = {'a':1,'b':2,'c':3}
d.update(d=4)
print(d)

# 輸出結果如下：
{'a': 1, 'b': 2, 'c': 3, 'd': 4}

洗掉元素

1）d.pop()
- key存在則移除，并回傳對應value值，
- key不存在，回傳給定的預設值，否則拋出KeyError，
```
d = {'a':1,'b':2,'c':3}
print(d.pop('c',None))
print(d)

# 輸出結果如下：
3
{'a': 1, 'b': 2}
```
2）d.popitem()
- 洗掉并回傳一個任意的item(key:value)，
- 如果是空字典，拋出KeyError，
```
d = {'a':1,'b':2,'c':3}
print(d.popitem())
print(d)

# 輸出結果如下：
('c', 3)
{'a': 1, 'b': 2}
```
3）d.clear()
- 洗掉所有item,不推薦使用，
```
d = {'a':1,'b':2,'c':3}
d.clear()
print(d)
```

查找元素

通過key這個鍵就可以快速找到value值，
時間復雜度是O(1)，不會隨著資料規模大而降低效率，

正常訪問元素：

d = {'a':1,'b':2,'c':3}
print(d['a'])
print(d.get('b'))

# 輸出結果如下：
1
2

key不存在的處理方式：

d = {'a':1,'b':2,'c':3}
print(d.get('d',None))  # 如果key不存在，預設回傳None
print(d.setdefault('d',100))  # 如果key不存在，則新增key:value對
print(d)

# 輸出結果如下：
None
100
{'a': 1, 'b': 2, 'c': 3, 'd': 100}

3.3 遍歷

遍歷鍵：key

d = {'a':1,'b':2,'c':3}
# 方法1：
for k in d:  # 預設是遍歷key
    print(k)
    
# 方法2：
for k in d.keys():
    print(k)

# 方法3：
for k, _ in d.items():
    print(k)
    
# 輸出結果如下：
a
b
c

遍歷值：value

d = {'a':1,'b':2,'c':3}
# 方法1：
for v in d.values():
    print(v)
    
# 方法2：
for k in d:
    # print(d[k])  # 也可以用
    print(d.get(k)) 
 
# 方法3：
for _, v in d.items():
    print(v)
    
# 輸出結果如下：
1
2
3

遍歷item：key-value

d = {'a':1,'b':2,'c':3}
for item in d.items():
    print(item)

# 輸出結果如下：
('a', 1)
('b', 2)
('c', 3)

其他問題

這種情況在遍歷的時候，不能夠洗掉元素，不能改變字典的size，

d = {'a':1,'b':2,'c':3}
for k in d:
    print(d.pop(k))
    
# 輸出結果如下：
RuntimeError: dictionary changed size during iteration

優雅的洗掉方式：

d = {'a':1,'b':2,'c':3}
key_list = []
for k in d:
    key_list.append(k)
for k in key_list:
    print('已洗掉key:', d.pop(k))

然并卵，想要清除，直接用clear()啦，

4.決議式和生成器運算式

4.1 串列決議式

語法

[ 回傳值 for 元素 in 可迭代物件 if 條件 ]
串列決議式用中括號'[ ]'表示
回傳一個新的串列

優點

提高效率
代碼輕量
可讀性高

示例需求：請從給定區間中提取能夠被2整除的元素，

大眾普遍的寫法：

list = []
for i in range(10):
    if i % 2 == 0:
        list.append(i)
print(list)

# 輸出結果如下：
[0, 2, 4, 6, 8]

再來感受一下簡單而優雅的寫法：

print([i for i in range(10) if i % 2 == 0])

# 輸出結果如下：
[0, 2, 4, 6, 8]

以上就是串列決議式，也叫串列推倒式，

4.2 生成器運算式

語法

( 回傳值 for 元素 in 可迭代物件 if 條件 )
生成器運算式用中括號'( )'表示
回傳一個生成器物件(generator)

特點：

按需計算，就是需要取值的時候才去計算（而串列決議式是一次性計算立即回傳所有結果）
前期并不怎么占用記憶體，最后取值多了就跟串列決議式一樣；
計算耗時極短，本身并不回傳結果，回傳的是生成器物件；

看下生成器物件是長什么樣的（不要認為是元組決議式，哈哈）：

x = (i for i in range(10) if i % 2 == 0)
print(type(x))
print(x)

# 輸出結果如下：
<class 'generator'>  # 生成器
<generator object <genexpr> at 0x000001A143ACBA98> # 生成器物件

那生成器物件是如何計算得到結果：

import time
x = (i for i in range(10) if i % 2 == 0)
for i in range(6):  # 僅一次回圈取值
    time.sleep(0.5)
    print(next(x))
 time.sleep(1)
print(next(x))  # for回圈已經計算完所有結果了，不能取值，故拋出例外

# 輸出結果如下：
0
2
4
6
8
StopIteration  # 已經超出可迭代范圍，拋出例外

備注：生成器運算式只能迭代一次，

4.3 集合決議式

集合決議式和串列決議式語法類似，不做過多決議，

語法：

{ 回傳值 for 元素 in 可迭代物件 if 條件 }
集合決議式用花括號'{ }'表示
回傳一個集合

示例：

print({i for i in range(10) if i % 2 == 0})

# 輸出結果如下：
{0, 2, 4, 6, 8}

4.4 字典決議式

字典決議式和集合決議式語法類似，不做過多決議，

語法：

{ key:value for 元素 in 可迭代物件 if 條件 }
字典決議式用花括號'{ }'表示
回傳一個字典

示例：

print({i:(i+1) for i in range(10) if i % 2 == 0})

# 輸出結果如下：
{0: 1, 2: 3, 4: 5, 6: 7, 8: 9}

總體來說，決議式寫起來如果讓人簡單易懂、又高效，是非常推薦大家使用的，

但有的場景寫起來很復雜，那還是得用for...in回圈拆分來寫，

如果喜歡的我的文章，歡迎關注我的公眾號：點滴技術，掃碼關注，不定期分享

公眾號：點滴技術

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/146931.html

標籤：Python

上一篇：怎么反爬蟲爬取網站資訊

下一篇：《自拍教程65》Python Testlink用例匯出工具xml2excel

Python哈希表和決議式