我想在 python 中使用 Flink 從 HDFS 讀取資料我發現使用 Java 或 Scala 是可能的: https ://nightlies.apache.org/flink/flink-docs-release-1.15/docs/connectors/dataset/formats/hadoop/
事實上,Flink HDFS 連接器提供了一個 Sink,可以將磁區檔案寫入 Hadoop FileSystem 支持的任何檔案系統。
我知道我需要使用 InputFormat 來嘗試指定它,但我在 Python 中找不到很好的指南。在 python (pyFlink) 中不支持這樣做
請任何幫助將不勝感激!
uj5u.com熱心網友回復:
我自己解決了這個問題,只需要配置hadoop的class_path并創建flink sql表) WITH ('connector' = 'filesystem', 'path' = 'hdfs://namenode:9000/directory/', 'format' = 'json')
轉載請註明出處,本文鏈接:https://www.uj5u.com/qukuanlian/521593.html
標籤:Hadoop高清晰度电视apache-flinkflink-sqlpyflink
上一篇:錯誤“PipeMapRed.waitOutputThreads():subprocessfailedwithcode1”當通過mapreducepython程式的hadoop上的索引訪問串列串列時
