我正試圖創建一個簡單的Spark結構化流應用,我需要從Kafka讀取一個流。然而,當我運行下面的代碼時:
df = spark
.readStream
.format("kafka"/span>)
.option("kafka.bootstrap.servers", "localhost:9092")
.option("subscribe, "mytopic" )。)
.加載()
然后我得到了以下錯誤:
我得到了以下錯誤:
AnalysisException: 未能找到資料源:Kafka。請按照"結構化流 Kafka集成指南"的部署部分部署該應用。
因此,根據《Structured Streaming Kafka Integration Guide》,我需要運行以下命令:
。./bin/spark-submit --packages org.apache. spark:spark-sql-kafka-0-10_2.12: 3.1.2 ...
這給了我一個我不理解的錯誤:
這給了我一個我不理解的錯誤:
Exception in thread "main" org.apache.spark.SparkException: 未能獲得主類 在JAR 與錯誤'檔案file:/home/myname/spark-3. 1.2-bin-hadoop3.2/...不存在'請指定一個with--class。
注意:在執行這個命令時,我在我的spark-3.1.2-bin-hadoop3.2檔案夾內。
uj5u.com熱心網友回復:
根據《結構化流媒體 Kafka集成指南》,我需要運行以下命令:
...不是字面意思。你需要提供命令的其余部分,其中包括--class
https://spark.apache.org/docs/latest/submitting-applications.html
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/328345.html
標籤:
