我對 delta Lake 檔案有疑問。我知道我可以使用 presto、hive、spark sql 和其他工具查詢 delta 表,但在 delta 的檔案中提到“您可以通過指定表名或路徑將 Delta 表加載為 DataFrame”

但目前還不清楚。我怎樣才能運行這樣的sql查詢?
uj5u.com熱心網友回復:
使用spark.sql()功能
spark.sql("select * from delta.`hdfs://192.168.2.131:9000/Delta_Table/test001`").show()
uj5u.com熱心網友回復:
要從 DeltaLake 中的表中讀取資料,可以在沒有 Apache Spark的情況下使用 Java API 或 Python 。詳見: https ://databricks.com/blog/2020/12/22/natively-query-your-delta-lake-with-scala-java-and-python.html
了解如何與 Pandas 一起使用:
pip3 install deltalake
python3
from deltalake import DeltaTable
table_path = "/opt/data/delta/my-table" # whatever table name and object store
# now using Pandas
df = DeltaTable(table_path).to_pandas()
df
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/419440.html
標籤:
下一篇:如何通過按鍵有條件地呈現輸入框
