本篇博客將為你介紹 itertools 模塊中處理可迭代集合的相關函式,
容器與可迭代物件
在正式開始前先補充一些基本概念在 Python 中存在容器 與 可迭代物件
- 容器:用來存盤多個元素的資料結構,例如 串列,元組,字典,集合等內容;
- 可迭代物件:實作了
__iter__方法的物件就叫做可迭代物件,
從可迭代物件中還衍生出 迭代器 與 生成器:
- 迭代器:既實作了
__iter__,也實作了__next__方法的物件叫做迭代器; - 生成器:具有
yield關鍵字的函式都是生成器,
這樣就比較清楚了,可迭代物件的范圍要大于容器,而且可迭代物件只能使用一次,使用完畢再獲取值就會提示 StopIteration 例外,
除此之外,可迭代物件還有一些限制:
- 不能對可迭代物件使用
len函式; - 可以使用
next方法處理可迭代物件,容器也可以通過iter函式轉換成迭代器; - for 陳述句會自動呼叫容器的
iter函式,所以容器也能被回圈迭代,
count() 函式
count 函式一般與 range 函式對比學習,例如 range 函式需要定義生成范圍的下限,上限與步長可選,而 count 函式不同,指定下限與步長,上限值不用宣告,
函式原型宣告如下
count(start=0, step=1) --> count object
測驗代碼如下,其中必須添加跳出回圈的判定條件,否則代碼會一直運行下去,
from itertools import count
a = count(5, 10)
for i in a:
print(i)
if i > 100:
break
除此之外,count 函式還接收非整數引數,所以下述代碼中定義的也是正確的,
from itertools import count
a = count(0.5, 0.1)
for i in a:
print(i)
if i > 100:
break
cycle 函式
用 cycle 函式可以回圈一組值,測驗代碼如下所示:
from itertools import cycle
x = cycle('夢想橡皮擦abcdf')
for i in range(5):
print(next(x), end=" ")
print("\n")
print("*" * 100)
for i in range(5):
print(next(x), end=" ")
代碼輸出如下內容:
夢 想 橡 皮 擦
****************************************************************************************************
a b c d f
可以看到 cycle 函式與 for 回圈非常類似,
repeat 函式
repeat 函式用于重復回傳某個值,官方給出的函式描述如下所示:
class repeat(object):
"""
repeat(object [,times]) -> create an iterator which returns the object
for the specified number of times. If not specified, returns the object
endlessly.
進行一下簡單的測驗,看一下效果:
from itertools import repeat
x = repeat('橡皮擦')
for i in range(5):
print(next(x), end=" ")
print("\n")
print("*" * 100)
for i in range(5):
print(next(x), end=" ")
怎么看這個函式,都好像沒有太大用處,
enumerate 函式,添加序號
這個函式在前面的文章中,已經進行過簡單介紹,并且該函式在 __builtins__ 包中,所以不再過多說明,基本格式如下所示:
enumerate(sequence, [start=0])
其中 start 引數是下標起始位置,
accumulate 函式
該函式基于給定的函式回傳一個可迭代物件,默認是累加效果,即第二個引數為 operator.add,測驗代碼如下:
from itertools import accumulate
data = [1, 2, 3, 4, 5]
# 計算累積和
print(list(accumulate(data))) # [1, 3, 6, 10, 15]
針對上述代碼,修改為累積,
from itertools import accumulate
import operator
data = [1, 2, 3, 4, 5]
# 計算累積
print(list(accumulate(data, operator.mul)))
除此之外,第二個引數還可以為 max,min 等函式,例如下述代碼:
from itertools import accumulate
data = [1, 4, 3, 2, 5]
print(list(accumulate(data, max)))
代碼輸出如下內容,其實是將 data 里面的任意兩個值進行了比較,然后留下最大的值,
[1, 4, 4, 4, 5]
chain 與 groupby 函式
chain 函式用于將多個迭代器組合為單個迭代器,而 groupby 可以將一個迭代器且分為多個子迭代器,
首先展示一下 groupby 函式的應用:
from itertools import groupby
a = list(groupby('橡橡皮皮擦擦'))
print(a)
輸出內容如下所示:
[('橡', <itertools._grouper object at 0x0000000001DD9438>),
('皮', <itertools._grouper object at 0x0000000001DD9278>),
('擦', <itertools._grouper object at 0x00000000021FF710>)]
為了使用 groupby 函式,建議先對原串列進行排序,因為它是有點像切片一樣,發現不同的就分出一個迭代器,
chain 函式的用法如下,將多個迭代物件進行拼接:
from itertools import groupby, chain
a = list(chain('ABC', 'AAA', range(1,3)))
print(a)
zip_longest 與 zip
zip 函式在之前的博客中已經進行過說明,zip_longest 與 zip 的區別就是,zip 回傳的結果以最短的序列為準,而 zip_longest 以最長的為準,
測驗代碼如下,自行比對結果即可,
from itertools import zip_longest
a = list(zip('ABC', range(5), [10, 20, 30, 40]))
print(a)
a = list(zip_longest('ABC', range(5), [10, 20, 30, 40]))
print(a)
zip_logest 如果碰到長度不一致的序列,缺少部分會填充 None,
tee 函式
tee 函式可以克隆可迭代物件,產出多個生成器,每個生成器都可以產出輸入的各個元素,
from itertools import tee
a = list(tee('橡皮擦'))
print(a)
compress 函式
該函式通過**謂詞(是否,True/False)**來確定對某個元素的取舍問題,最簡單的代碼如下所示:
from itertools import compress
a = list(compress('橡皮擦', (0, 1, 1)))
print(a)
islice、dropwhile、takewhile、filterfalse、filter
這幾個函式都是從輸入的可迭代物件中獲取一個子集,而且不修改元素本身,
本部分只羅列各個函式的原型宣告,具體用法直接參考使用即可,
islice(iterable, stop) --> islice object
islice(iterable, start, stop[, step]) --> islice object
dropwhile(predicate, iterable) --> dropwhile object
takewhile(predicate, iterable) --> takewhile object
filterfalse(function or None, sequence) --> filterfalse object
其中只有 filterfalse 中的引數是函式在前,序列在后,
測驗代碼如下,尤其注意第一個引數是 callable 即函式,
from itertools import islice, dropwhile, takewhile, filterfalse
a = list(filterfalse(lambda x: x in ["皮", "擦"], '橡皮擦'))
print(a)
寫在后面
以上內容就是本文的全部內容,在使用無限迭代器函式 count,cycle,repeat 的時候,一定要注意即使停止,
今天是持續寫作的第 218 / 365 天,
可以關注,點贊、評論、收藏,
更多精彩
- 滾雪球學 Python(完結)
- 滾雪球學 Python 第二輪(完結)
- 滾雪球學 Python 第三輪
- 滾雪球學 Python 番外篇(完結)
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/299682.html
標籤:python
