我知道 Pandas 提供了多種索引資料的方法,我想知道從性能的角度來看,以下兩種方法之間是否存在差異,即哪個更快或兩者相同?
# method 1
df = table.loc[table.some_col==True, :]
# method 2
df = table[table.some_col==True]
uj5u.com熱心網友回復:
第二個更快一點,對我來說它是有意義的,因為第一個解決方案是組合DataFrame.loc和boolean indexing,第二個boolean indexing:
np.random.seed(2021)
table = pd.DataFrame(np.random.rand(10**7, 5), columns=list('abcde'))
table['some_col'] = table.a > 0.6
In [130]: %timeit table.loc[table.some_col==True, :]
258 ms ± 2.39 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
In [131]: %timeit df = table[table.some_col==True]
241 ms ± 1.52 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/384389.html
上一篇:替換csv列的特定值中的“空格”
