我正在嘗試使用 python 將科學論文的 PDF 檔案從一種名稱模式自動重命名為另一種名稱模式。
PDF 出現的名稱模式如下所示:
Cresswell, K.、Worth, A. 和 Sheikh, A. (2011)。實施和采用電子健康記錄系統。臨床治理——國際期刊。
即“LastName1, FirstLetterGivenName1., LastName2, FirstLeterGivenName2., [...]. (Year). Title. Journal.”
此示例的名稱模式應重命名為如下所示:
Creswell_K_2011_實施和采用
即“LastName1_FirstLetterGivenName1_Year_First3LettersTitle”
遺憾的是,我無法將解決類似問題的解決方案應用于這個特定的問題,因為我剛剛開始編碼。
uj5u.com熱心網友回復:
您可以使用正則運算式,例如:
import re
s = "Cresswell, K., Worth, A., & Sheikh, A. (2011). Implementing and adopting electronic health record systems. Clinical governance- an international journal."
p = re.compile(r'(?P<LastName1>[A-Za-z] ),\s (?P<GivenName1>[A-Za-z] )\.?,. \((?P<Year>\d )\)\.\s (?P<Title1>\w )\s(?P<Title2>\w )\s(?P<Title3>\w )')
m = p.search(s)
if m is not None:
d = m.groupdict()
result = d['LastName1'] '_' d['GivenName1'][0] '_' d['Year'] '_' d['Title1'] ' ' d['Title2'] ' ' d['Title3']
print(result)
這給出了輸出:
Creswell_K_2011_實施和采用
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/327211.html
