1. glob檔案名模式匹配
盡管glob API很小,但這個模塊的功能卻很強大,只要程式需要查找檔案系統中名字與某個模式匹配的一組檔案,就可以使用這個模塊,要創建一個檔案名串列,要求其中各個檔案名都有某個特定的擴展名、前綴或者中間都有某個共同的字串,就可以使用glob而不用撰寫定制代碼來掃描目錄內容,
glob的模式規則與re模塊使用的正則運算式并不相同,實際上,glob的模式遵循標準UNIX路徑擴展規則,只使用幾個特殊字符來實作兩個不同的通配符和字符區間,模式規則應用于檔案名中的段(在路徑分隔符/處截止),
1.1 實體資料
本節中的示例假定當前作業目錄中存在以下測驗檔案,
test_files test_files/file.txt test_files/file1.txt test_files/file2.txt test_files/filea.txt test_files/fileb.txt test_files/subfiles test_files/subfiles/subfile.txt
如果這些檔案不存在,請glob_maketestdata.py在運行以下示例之前使用示例代碼創建它們,

1.2 通配符
星號(*)匹配一個檔案名段中的0個或多個字符,例如,test_files/*,
import glob for name in sorted(glob.glob('test_files/*')): print(name)
這個模式會匹配目錄test_files中的所有路徑名(檔案或目錄),但不會進一步遞回搜索到子目錄,glob()回傳的資料不會排序,所以這里的實體會進行排序以便研究結果,

要列出子目錄中的檔案,必須把子目錄包含在模式中,
import glob print('Named explicitly:') for name in sorted(glob.glob('test_files/subfiles/*')): print(' {}'.format(name)) print('Named with wildcard:') for name in sorted(glob.glob('test_files/*/*')): print(' {}'.format(name))
前面顯示的第一種情況顯式列出了子目錄名,第二種情況則依賴一個通配符來查找目錄,

在這里,兩種做法的結果是一樣的,如果還有另一個子目錄,則通配符會匹配這兩個子目錄,并且兩個子目錄中的檔案名都會出現在結果中,
1.3 單字符通配符
問號(?)也是一個通配符,它會匹配檔案名中該位置的單個字符,
import glob for name in sorted(glob.glob('test_files/file?.txt')): print(name)
前面的例子會匹配以file開頭,然后是另外一個任意字符,最后以.txt結尾的所有檔案名,

1.4 字符區間
如果使用字符區間([a-z])而不是問號,則可以匹配多個字符中的一個字符,下面這個例子會查找名字中擴展名前有一個數字的所有檔案,
import glob for name in sorted(glob.glob('test_files/*[0-9].*')): print(name)
字符區間[0-9]會匹配所有單個數字,區間根據各字母/數字的字符碼排序,短橫線指示連續字符組成的一個不間斷區間,這個區間值也可以寫為[0123456789],

1.5 轉義元字符
有時有必要搜索名字中包含一些特殊元字符的檔案,glob使用這些特殊元字符表示模式,escape()函式會建立一個適合的模式,其中的特殊字符會被“轉義”,使它們不會被glob擴展或解釋為特殊字符,
import glob specials = '?*[' for char in specials: pattern = 'test_files/*' + glob.escape(char) + '.txt' print('Searching for: {!r}'.format(pattern)) for name in sorted(glob.glob(pattern)): print(name) print()
可以通過構建一個包含單個元素的字符區間來轉義各個特殊字符,

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/178322.html
標籤:Python
