我有一個資料集,可以在這個網站上找到:http: //tennis-data.co.uk/alldata.php。它收集了幾年來 WTA 和 ATP 網球比賽的結果。
我想知道球員“費德勒R”做了多少組。在 2016 年和 2017 年期間獲勝,為此我使用了 .loc 函式,如下所示:
df = df_atp.loc[df_atp["Date"].between("01/01/2016", "31/12/2017"), ['Winner', 'Wsets']]
print(df)
當我列印 df 時,結果如下:(部分是因為整個結果很長) 結果
我認為我走在正確的道路上,但我只想讓費德勒出現在我的成績單上,但就像圖片顯示的那樣,我擁有其他所有球員。我試圖["Federer R."]在 .loc 函式的末尾添加,但它只會給我一個錯誤。
我可以在 .loc 函式中添加什么以使結果中只有費德勒?
先感謝您!:D
uj5u.com熱心網友回復:
df = df_atp.loc[df_atp["Date"].between("01/01/2016", "31/12/2017"), ['Winner', 'Wsets']]
df = df[df['Winner'] == 'Federer R.']
print(df)
是最易讀的方法。你也可以做
df = df_atp.loc[df_atp["Date"].between("01/01/2016", "31/12/2017") & (df['Winner'] == 'Federer R.'), ['Winner', 'Wsets']]
在一行中完成,但我更喜歡第一種易讀性方法。
uj5u.com熱心網友回復:
在“查詢”資料框時,請考慮使用,query因為與其他選項相比,它可以提供性能改進。
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/480588.html
上一篇:用熊貓分隔行之間的值
下一篇:比較兩個資料幀中的兩個不同列
