在python3的互動式視窗中,引入pyspark包,并創建SparkSession,就可以用spark.read.csv("csv path")讀取一個 csv格式的檔案,但是,如果是hdfs格式的csv檔案卻不行,報錯:py4j.protocol.Py4JJavaError: An error occurred while calling o40.csv.
看了一下python官網,有其他的方式可以讀取hdfs檔案。為什么spark.read.csv("csv path") 這種方式不行呢?
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/139399.html
