我正在嘗試使用這樣的 toDF 函式生成資料框
當我看到 Spark UI 時,運行 df.show action 后,我沒有看到任何 DAG,為什么會這樣?
uj5u.com熱心網友回復:
因為它在記憶體中,沒有呼叫并行化;有一個 Spark 優化可以立即完成,Seq用于創建dataframe.
同樣通過這個:
val df = sc.parallelize(1 until 5).toDF("a")
確實產生 Job / DAG 作為工人,涉及分配。
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/447324.html
標籤:阿帕奇火花
