函式式編程中的字串
在函式式編程中,經常用到 Python 字串,因其是不可變資料結構,
字串本身是一個物件,具備很多物件方法,與常識中函式的使用不太相同,例如下述代碼
my_str = "xiangpica"
print(my_str.upper())
print(len(my_str.upper()))
其中 len() 函式的用法被稱為前置寫法,而 my_str.upper() 被稱為后置寫法,這樣很容易造成函式式編程的理解問題,所以需要系統性的解決該問題,
如果上述代碼可以修改為 len(upper(my_str)),就變得相對容易理解,
# 型別 Text 是 str 的別名
from typing import Text
my_str = "xiangpica"
def upper(str: Text) -> Text:
return str.upper()
print(upper(my_str))
print(len(upper(my_str)))
上述代碼重新定義了一個前置用法的函式 upper,用于解決函式式編程中的一致性問題,該解決辦法在后續代碼中會經常出現,
不變型別元組
除字串外,Python 中的另一個不可變資料型別為元組,元組分為普通元組與命名元組,
普通元組的宣告與訪問
在之前的滾雪球系列中對元組的基本知識,已經進行了說明,可以去稍微復習一下,然后在進入本文的學習,
先看一下代碼,然后再判斷是否可以理解,
from typing import Tuple, Text, Callable
LANGUAGE = Tuple[Text, Text, Text]
python: Callable[[LANGUAGE], Text] = lambda languages: languages[1]
items = ("c","python","js")
a = python(items)
print(a)
上述代碼定義了一個新的型別 LANGUAGE,該型別是一個元組,具備三個元素,
python 型別注解是 Callable[[LANGUAGE], Text],即它的引數是 LANGUAGE 型別,回傳值是字串型別,
注意 typing 模塊加入不會影響程式的運行不會報正式的錯誤,僅作為型別檢查,防止運行時出現引數、回傳值型別不符,開發人員查閱,
除上述內容外,還可以使用命名元組來實作,
from collections import namedtuple
Language = namedtuple("Language",("name1", "name2", "name3"))
l = Language("c", "python", "js")
print(l)
print(l.name1)
或者直接使用 typing 模塊的 NamedTuple 也可以,
from typing import NamedTuple, Text
class Language(NamedTuple):
name: Text
description: Text
l = Language("C", "C語言")
print(l)
print(l.name)
print(l.description)
函式式的分類
函式大類分為兩種:
標量函式:函式的回傳結果為一個值;集合函式:函式的結果為可迭代的集合,
集合函式也可以細分:
規約/累積函式:將集合內的元素進行累積計算,最后得到一個值;映射函式:將標量函式應用于幾個的每個元素,最后得到一個與原集合相同長度的新集合;過濾函式:將標量函式應用于每個元素,保留一部分,得到一個子集,
有了上述概念之后,對于函式式編程的理解可以更進一步,
any() 、all() 、len()、sum() 對比學習
any 與 all 兩個函式屬于規約函式,進行的操作叫做布爾規約,即將一個集合的元素歸約為 True 或者 False,all 需要所有值都是 True,any 只要有一個值是 True 即可,
len 與 sum 也是歸約函式,它們分別表示計算集合中所有值的個數和匯總值,
zip()、reversed()、enumerate()
zip 函式可以把多個可迭代物件或者序列,之間的資料進行交叉組合,即將 n 個元素的可迭代物件轉換為 n 元組,然后回傳一個生成器,
如果 zip 函式沒有輸入引數,那將回傳一個空串列 [],
a = zip()
print(list(a))
reversed 函式用于改變序列順序,即反轉序列,
enumerate 函式獲取序列或者可迭代物件的下標值,轉換成概念描述就是將可迭代物件映射為二元組序列(帶上序號了),每個二元組序列中,第一個元素是下標值,第二個元素是值本身,
高階函式
學習 Python 函式式編程,繞不開高階函式的學習,高階函式就是以函式為引數,或者以回傳值為函式的函式,
函式 max 和 min()
上述兩個函式是規約函式,即輸入的是集合,輸出的是單個值,主要用途就是尋找極值,
一般在學習的時候,可以把二者當成普通的函式,也可用于高階函式,主要為引數位置的差異,
最簡單的用法為:
max_num = max(1, 2, 3, 4)
min_num = min(1, 2, 3, 4)
print(max_num)
print(min_num)
接下來就是其高階函式模式的實作,自定義比較規則,
# 第一種寫法,比較字串長度
max_num = max("a", "abc", "ceda", "aaaaa", key=lambda x: len(x))
min_num = min("a", "abc", "ceda", "aaaaa", key=lambda x: len(x))
print(max_num)
print(min_num)
# 第二種寫法,比較字串長度
max_num = max(["a", "abc", "ceda", "aaaaa"], key=lambda x: len(x))
min_num = min(["a", "abc", "ceda", "aaaaa"], key=lambda x: len(x))
print(max_num)
print(min_num)
上述代碼的 key 為可選引數,默認值為 None,
map 函式
map 函式用于將一個集合映射到另一個集合,例如可以將一個由字串組成的串列中的每一項,都轉換為整數,
data = ["1", "2", "3"]
print(map(int, data))
print(list(map(int, data)))
代碼 map(int, data) 的含義就是將 int 函式作用于 data 中的每一項,
map 函式的第一個引數也可以用 lambda 代替,
data = ["1", "2", "3"]
print(map(lambda x: int(x), data))
print(list(map(int, data)))
filter 函式
filter 函式主要用于將一個**判定函式(謂語函式)**用于集合的每一個元素,最后得到滿足判定函式的結果集,測驗代碼如下:
data = [1, 3, 5, 7, 9]
print(filter(lambda x: x > 3, data))
print(list(filter(lambda x: x > 3, data)))
sorted 函式
sorted 函式也支持高階函式 key 引數定制規則,
result = sorted(["afghsss", "abc", "ceda", "aaaaa"], key=lambda x: len(x))
print(result)
同一需求的不同效率問題
通過 map 函式,生成器運算式,存在迭代器的生成器函式分別多 一億 資料量的串列進行測驗,
import time
def demo(x):
return x * 2
def demo1(f, l):
for x in l:
yield f(x)
my_list = list(range(1, 10000000))
start = time.perf_counter()
# map(lambda x: x * 2, my_list) # 程式運行耗時 3.904999999998493e-06
# (demo(x) for x in my_list) # 程式運行耗時 6.310000000009364e-06
demo1(demo, my_list) # 程式運行耗時 5.1070000000041915e-06
cost_time = time.perf_counter() - start
print("程式運行耗時", cost_time)
得到的結果是 map 最快,所以用就完事了,
寫在后面
滾雪球學 Python 第四輪,非常理論的一個系列,跟上大部隊的節奏,走起來,有任何問題,都可以在評論區留言,一般 1 小時之內都能解決,
今天是持續寫作的第 215 / 365 天,
可以關注,點贊、評論、收藏,
更多精彩
- 滾雪球學Python(完結)
- 滾雪球學Python第二輪(完結)
- 滾雪球學Python第三輪
- 滾雪球學 Python 番外篇(完結)
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/299000.html
標籤:其他
