我有一個包含 url 的資料框,必須對其進行驗證并獲得作為串列的有效結果。用于驗證 url 的模塊是validatorsmodule。
資料框就像
pd.DataFrame({'url':['https://quotes.toscrape.com/','https://www.nashvillesymphony.org/','www.google.com']})
需要輸出
['https://quotes.toscrape.com/','https://www.nashvillesymphony.org/']
嘗試data.loc[lambda data: validators.url(data.url) == True]但出現錯誤TypeError: expected string or bytes-like object
uj5u.com熱心網友回復:
您可以通過以下方式做到這一點
results = [x for x in df["url"].values if validators.url(x) == True]
uj5u.com熱心網友回復:
您可以使用:
import validators
mask1 = df["url"].apply(validators.url) == True
df[mask1]
輸出
| 網址 | |
|---|---|
| 0 | https://quotes.toscrape.com/ |
| 1 | https://www.nashvillesymphony.org/ |
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/443598.html
上一篇:pandas按ID計算分組
