如果我們有一張大桌子。我從中創建了一個 DataFrame。在另一個火花會議中,我需要同一張桌子。有什么辦法可以使用同一個表在兩個不同的 spark 會話中創建資料幀?
uj5u.com熱心網友回復:
看看createGlobalTempView它將在 Spark Sessions 中可用。
如果您希望有一個在所有會話之間共享的臨時視圖并在 Spark 應用程式終止之前保持活動狀態,您可以創建一個全域臨時視圖。
更多資訊:https : //spark.apache.org/docs/latest/sql-getting-started.html#global-temporary-view
uj5u.com熱心網友回復:
創建配置單元表或將 parquet/Orc 檔案寫入共享檔案夾?
它更持久,但可能有意義,因此一個火花會話結束不能殺死其他資料。
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/363986.html
上一篇:有沒有辦法在不首先在pyspark.sql.DataFrame上呼叫它的情況下獲取pyspark.sql.column.Column的dtype?
下一篇:從超類回傳__str__時出錯
