我有這樣的資料。我要做的是根據我的專案的域名創建一個規則。我想根據域創建一個名為 new_url 的新列。如果它包含 .cdn。它將采用.cdn 之前的字串。, 否則會呼叫 url parser library 并以另一種方式決議 url。問題是在我創建的 csv 檔案 (cleanurl.csv) 中,沒有創建 new_url 列。當我在代碼中列印決議的 url 時,我可以看到它們。if 和 else 條件有效。請問你能幫幫我嗎 ?

import pandas as pd
import url_parser
from url_parser import parse_url,get_url,get_base_url
import numpy as np
df = pd.read_csv("C:\\Users\\myuser\\Desktop\\raw_data.csv", sep=';')
i=-1
for x in df['domain']:
i=i 1
print("*",x,"*")
if '.cdn.' in x:
parsed_url=x.split('.cdn')[0]
print(parsed_url)
df.iloc[i]['new_url']=parsed_url
else:
parsed_url=get_url(x).domain '.' get_url(x).top_domain
print(parsed_url)
df.iloc[i]['new_url']=parsed_url
df.to_csv("C:\\Users\\myuser\\Desktop\\cleanurl.csv", sep=';')
uj5u.com熱心網友回復:
用于.loc[row, 'column']創建新列
for idx, x in df['domain'].items():
if '.cdn.' in x:
df.loc[idx, 'new_url'] = parsed_url
else:
df.loc[idx, 'new_url'] = parsed_url
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/521119.html
上一篇:將字串轉換為浮點值
