我正在使用Regex,目前我正試圖從PDF中提取姓名、IFSC和帳戶號碼。 我正在使用以下代碼來提取細節。
acc_name= " "/span>, '
.join([re.sub(r'^[d ] |[d ] :$', ' ', line) for line in data. splitlines() if 'Mr. ' in line] )
acc_no= " "/span>, '
.join([re.sub(r'Account Numbers :', '', line) for line in data. splitlines() if 'Account Number' in line] )
acc_code = " ", '
.join([re.sub(r'IFSC Codes :', '', line) for line in data. splitlines() if 'IFSC Code' in line] )
但我得到的資料是:
(' '/span>, ' 50439602642'/span>)
(' ', 'Mr. MOHD AZFAR ALAM LARI')
(' '/span>, ' ALLA0211993')
我想洗掉逗號、括號和引號。我是regex的新手,所以希望能得到任何幫助。
uj5u.com熱心網友回復:
你正在創建一個元組:
>>> " ", "
'
(" ", "
')
>>>。
正如你所看到的,一個元組被創建了,所以無論是你的意思是:
acc_name= '
.join([re.sub(r'^[d ] |[d ] :$', ' ', line) for line in data. splitlines() if 'Mr. ' in line] )
acc_no= '
'.join([re.sub(r'Account Numbers :', ', line) for line in data. splitlines() if 'Account Number' in line] )
acc_code = '
.join([re.sub(r'IFSC Codes :', '', line) for line in data. splitlines() if 'IFSC Code' in line] )
或者只是一個空格:
acc_name= ' '.join([re. sub(r'^[d ] |[d ] :$', '', line) for linein data. splitlines() if 'Mr. ' in line] )
acc_no= ' '.join([re.sub(r'Account Numbers :', ', line) for line in data. splitlines() if 'Account Number' in line] )
acc_code = ' '.join([re.sub(r'IFSC Codes :', ', line) for line in data. splitlines() if 'IFSC Code' in line] )
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/332343.html
標籤:
