我有一個資料集,包含網頁的網址。 我有這樣的東西:
我試圖用最后一個"/"后面的內容來替換所有的尿液,所以我簡單地使用
。df["url"].str. split("/").str[-1]
但是我想讓那些由字母和數字組成的長字串(如第三個鏈接)被替換為 "valid",而那些在最后一個"/"后面沒有任何內容的UR被替換為 "home_page",我如何實作這個目標?
我希望能有這樣的結果:
- 登錄
- home_page
- valid
uj5u.com熱心網友回復:
你可以用以下方式決議網址 這個。然后你可以替換。
uj5u.com熱心網友回復:
請找到實作上述要求的代碼:
urls = ["https://abc.eu/login"/span>, "https://abc.eu/"/span>, "https://abc.eu/ar35gjdb4"/span>]
for url in urls:
s = url.rsplit('/'/span>, 1)
if s[1] == 'login':
print(os.path.join(s[0], 'login')
elif s[1] == '':
print(os.path.join(s[0], 'home_page')
elif re.match('^[a-zA-Z0-9_] $', s[1] )。)
print(os.path.join(s[0], 'valid')
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/319530.html
標籤:
