我想使用 pyspark DataFrame 函式而不是 SQL 查詢來復制以下代碼。
spark.sql("select date from walmart_stock order by high desc limit 1").show()
資料集鏈接
uj5u.com熱心網友回復:
如果您從鏈接的 CSV 檔案開始,這里是代碼。您應該認識 SQL 函式。請注意,我們使用該inferSchema選項是為了直接將數字決議為雙精度數并獲得正確的排序(對于默認字串型別,它不會按預期作業)。另一種方法是在閱讀 CSV 后轉換列。
spark.read
.option("header", "true")
.option("inferSchema", "true")
.csv("walmart_stock.csv")
.orderBy(f.col("High"), desc=True)
.limit(1)
.select("Date")
.show()
這產生
----------
| Date|
----------
|2015-11-13|
----------
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/363976.html
