Python - 那些年我們踩過的那些坑-有解無憂

坑1、整數比較的坑

在Python中一切都是物件，整數也是物件，在比較兩個整數時有兩個運算子“==”和“is”，它們的區別是：

·is比較的是兩個整數物件的id值是否相等，也就是比較兩個參考是否代表了記憶體中同一個地址，

·==比較的是兩個整數物件的內容是否相等，使用==時其實是呼叫了物件的__eq__()方法，

知道了is和==的區別之后，我們可以來看看下面的代碼，了解Python中整數比較有哪些坑：

#! /usr/bin/env python3
# -*- coding:utf-8 -*-

# Author   : Ma Yi
# Blog     : http://www.cnblogs.com/mayi0312/
# Date     : 2020-03-19
# Name     : test01
# Software : PyCharm
# Note     : 整數比較的坑


def main():
    x = y = -1
    while True:
        x += 1
        y += 1
        if x is y:
            print("%d is %d" % (x, y))
        else:
            print("Attention! %d is not %d" % (x, y))
            break
    x = y = 0
    while True:
        x -= 1
        y -= 1
        if x is y:
            print("%d is %d" % (x, y))
        else:
            print("Attention! %d is not %d" % (x, y))
            break


# 入口函式
if __name__ == '__main__':
    main()

程式運行結果（部分）：

……略
252 is 252
253 is 253
254 is 254
255 is 255
256 is 256
Attention! 257 is not 257
-1 is -1
-2 is -2
-3 is -3
-4 is -4
-5 is -5
Attention! -6 is not -6

出現這個結果的原因是Python出于對性能的考慮所做的一項優化，對于整數物件，Python把一些頻繁使用的整數物件快取起來，保存到一個叫small_ints的鏈表中，在Python的整個生命周期內，任何需要參考這些整數物件的地方，都不再重新創建新的物件，而是直接參考快取中的物件，Python把頻繁使用的整數物件的值定在[-5, 256]這個區間，如果需要這個范圍的整數，就直接從small_ints中獲取參考而不是臨時創建新的物件，因為大于256或小于-5的整數不在該范圍之內，所以就算兩個整數的值是一樣，但它們是不同的物件，

當然僅僅如此這個坑就不值一提了，如果你理解了上面的規則，我們就再看看下面的代碼，

#! /usr/bin/env python3
# -*- coding:utf-8 -*-

# Author   : Ma Yi
# Blog     : http://www.cnblogs.com/mayi0312/
# Date     : 2020-03-19
# Name     : test01
# Software : PyCharm
# Note     : 整數比較的坑


a = 257


def main():
    b = 257
    c = 257
    print(b is c)  # True
    print(a is b)  # False
    print(a is c)  # False


# 入口函式
if __name__ == '__main__':
    main()

程式的執行結果已經用注釋寫在代碼上了，夠坑吧！看上去a、b和c的值都是一樣的，但是is運算的結果卻不一樣，為什么會出現這樣的結果，首先我們來說說Python程式中的代碼塊，所謂代碼塊是程式的一個最小的基本執行單位，一個模塊檔案、一個函式體、一個類、互動式命令中的單行代碼都叫做一個代碼塊、上面的代碼由兩個代碼塊構成，a = 257是一個代碼塊，main函式是另外一個代碼塊，Python內部為了進一步提高性能，凡是在一個代碼塊中創建的整數物件，如果值在small_ints快取范圍之內，但在同一個代碼塊中已經存在一個值與其相同的整數物件了，那么就直接參考該物件，否則創建一個新的物件出來，這條規則對不在small_ints范圍的負數并不適用，對負數值浮點數也不適用，但對非負浮點數和字串都是適用的，這一點自行證明，所以b is c回傳了True，而a和b不在同一個代碼塊中，雖然值都是257，但卻是兩個不同的物件，is運算的結果自然是False了，

坑2、嵌套串列的坑

Python中有一種內置的資料型別叫串列，它是一種容器，可以用來承載其他的物件（準確的說是其他物件的參考），串列中的物件可以稱為串列的元素，很明顯我們可以把串列作為串列中的元素，這就是所謂的嵌套串列，嵌套串列可以模擬出現實中的表格、矩陣、2D游戲的地圖（如植物大戰僵尸的花園）、棋盤（如國際象棋、黑白棋）等，但是在使用嵌套的串列時要小心，否則很可能遭遇非常尷尬的情況，下面是一個小例子，

#! /usr/bin/env python3
# -*- coding:utf-8 -*-

# Author   : Ma Yi
# Blog     : http://www.cnblogs.com/mayi0312/
# Date     : 2020-03-19
# Name     : test02
# Software : PyCharm
# Note     : 嵌套串列的坑


# 入口函式
if __name__ == '__main__':
    names = ["關羽", "張飛", "趙云", "馬超", "黃忠"]
    subjs = ["語文", "數學", "英語"]
    scores = [[0] * 3] * 5
    for row, name in enumerate(names):
        print("請輸入%s的成績" % name)
        for col, subj in enumerate(subjs):
            scores[row][col] = float(input(subj + ": "))
            print(scores)

我們希望錄入5個學生3門課程的成績，于是定義了一個有5個元素的串列，而串列中的每個元素又是一個由3個元素構成的串列，這樣一個串列的串列剛好跟一個表格是一致的，相當于有5行3列，接下來我們通過嵌套的for-in回圈輸入每個學生3門課程的成績，程式執行完成后我們發現，每個學生3門課程的成績是一模一樣的，而且就是最后錄入的那個學生的成績，

要想把這個坑填平，我們首先要區分物件和物件的參考這兩個概念，而要區分這兩個概念，還得說說記憶體中的堆疊和堆，我們經常會聽人說起“堆疊”這個詞，但實際上“堆”和“堆疊”是兩個不同的概念，眾所周知，一個程式運行時需要占用一些記憶體空間來存盤資料和代碼，那么這些記憶體從邏輯上又可以做進一步的劃分，對底層語言（如C語言）有所了解的人大都知道，程式中可以使用的記憶體從邏輯上可以分為五個部分，按照地址從高到低依次是：堆疊（stack）、堆（heap）、資料段（data segment）、只讀資料段（static area）和代碼段（code segment），其中，堆疊用來存盤區域、臨時變數，以及函式呼叫時保存現場和恢復現場需要用到的資料，這部分記憶體在代碼塊開始執行時自動分配，代碼塊執行結束時自動釋放，通常由編譯器自動管理；堆的大小不固定，可以動態的分配和回收，因此如果程式中有大量的資料需要處理，這些資料通常都放在堆上，如果堆空間沒有正確的被釋放會引發記憶體泄露的問題，而像Python、Java等編程語言都使用了垃圾回識訓制來實作自動化的記憶體管理（自動回收不再使用的堆空間），所以下面的代碼中，變數a并不是真正的物件，它是物件的參考，相當于記錄了物件在堆空間的地址，通過這個地址我們可以訪問到對應的物件；同理，變數b是串列容器的參考，它參考了堆空間上的串列容器，而串列容器中并沒有保存真正的物件，它保存的也僅僅是物件的參考，

a = b = ["apple", "pitaya", "grape"]

知道了這一點，我們可以回過頭看看剛才的程式，我們對串列進行[[0] * 3] * 5操作時，僅僅是將[0, 0, 0]這個串列的地址進行了復制，并沒有創建新的串列物件，所以容器中雖然有5個元素，但是這5個元素參考了同一個串列物件，這一點可以通過id函式檢查scores[0]和scores[1]的地址得到證實，所以正確的代碼應該按照如下的方式進行修改，

#! /usr/bin/env python3
# -*- coding:utf-8 -*-

# Author   : Ma Yi
# Blog     : http://www.cnblogs.com/mayi0312/
# Date     : 2020-03-19
# Name     : test02
# Software : PyCharm
# Note     : 嵌套串列的坑


# 入口函式
if __name__ == '__main__':
    names = ["關羽", "張飛", "趙云", "馬超", "黃忠"]
    subjs = ["語文", "數學", "英語"]
    scores = [[]] * 5
    for row, name in enumerate(names):
        print("請輸入%s的成績" % name)
        scores[row] = [0] * 3
        for col, subj in enumerate(subjs):
            scores[row][col] = float(input(subj + ": "))
            print(scores)

或者

#! /usr/bin/env python3
# -*- coding:utf-8 -*-

# Author   : Ma Yi
# Blog     : http://www.cnblogs.com/mayi0312/
# Date     : 2020-03-19
# Name     : test02
# Software : PyCharm
# Note     : 嵌套串列的坑


# 入口函式
if __name__ == '__main__':
    names = ["關羽", "張飛", "趙云", "馬超", "黃忠"]
    subjs = ["語文", "數學", "英語"]
    scores = [[0] * 3 for _ in range(5)]
    for row, name in enumerate(names):
        print("請輸入%s的成績" % name)
        for col, subj in enumerate(subjs):
            scores[row][col] = float(input(subj + ": "))
            print(scores)

坑3、訪問修飾符的坑

用Python做過面向物件編程的人都知道，Python的類提供了兩種訪問控制權限，一種是公開，一種是私有（在屬性或方法前加上雙下劃線），而用慣了Java或C#這類編程語言的人都知道，類中的屬性（資料抽象）通常都是私有的，其目的是為了將資料保護起來；而類中的方法（行為抽象）通常都是公開的，因為方法是物件向外界提供的服務，但是Python并沒有從語法層面確保私有成員的私密性，因為它只是對類中所謂的私有成員進行了命名的變換，如果知道命名的規則照樣可以直接訪問私有成員，請看下面的代碼，

#! /usr/bin/env python3
# -*- coding:utf-8 -*-

# Author   : Ma Yi
# Blog     : http://www.cnblogs.com/mayi0312/
# Date     : 2020-03-19
# Name     : test03
# Software : PyCharm
# Note     : 訪問修飾符的坑


class Student(object):

    def __init__(self, name, age):
        self.__name = name
        self.__age = age

    def __str__(self):
        return self.__name + ": " + str(self.__age)


# 入口函式
if __name__ == '__main__':
    stu = Student("螞蟻", 20)
    print(stu._Student__name)
    print(stu._Student__age)

Python為什么要做出這樣的設定呢？用一句廣為流傳的格言來解釋這個問題：“We are all consenting adults here”（我們都是成年人），這句話表達了很多Python程式員的一個共同觀點，那就是開放比封閉要好，我們應該自己對自己的行為負責而不是從語言層面來限制對資料或方法的訪問，

所以在Python中我們實在沒有必要將類中的屬性或方法用雙下劃線開頭的命名處理成私有的成員，因為這并沒有任何實際的意義，如果想對屬性或方法進行保護，我們建議用單下劃線開頭的受保護成員，雖然它也不能真正保護這些屬性或方法，但是它相當于給呼叫者一個暗示，讓呼叫者知道這是不應該直接訪問的屬性或方法，而且這樣做并不影響子類去繼承這些東西，

需要提醒大家注意的是，Python類中的那些魔法方法，如__str__、__repr__等，這些方法并不是私有成員哦，雖然它們以雙下劃線開頭，但是他們也是以雙下劃線結尾的，這種命名并不是私有成員的命名，這一點對初學者來說真的很坑，

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/170793.html

標籤：Python

上一篇：首例爬蟲禁令：法院裁定立即停止擅自爬取微信公眾號相關資料行為取微信公眾號相關資料行為

下一篇：Scrapy爬蟲框架