我正在嘗試使用 Dask 從 kaggle 中的 sqlite 資料庫中讀取表,
鏈接到資料庫:https : //www.kaggle.com/datasets/marcilonsilvacunha/amostracnpj?select=amostraCNPJ.sqlite 這個資料庫中的一些表非常大,我想測驗 dask 如何處理它們。我為較小的 sqlite 資料庫中的一個表撰寫了以下代碼:
import dask.dataframe as ddf
import sqlite3
# Read sqlite query results into a pandas DataFrame
con = sqlite3.connect("/kaggle/input/amostraCNPJ.sqlite")
df = ddf.read_sql_table('cnpj_dados_cadastrais_pj', con, index_col='cnpj')
# Verify that result of SQL query is stored in the dataframe
print(df.head())
這給出了一個錯誤:
AttributeError:“sqlite3.Connection”物件沒有屬性“_instantiate_plugins”
任何幫助都將不勝感激,因為這是我第一次使用 Dask 來閱讀 sqlite。
uj5u.com熱心網友回復:
正如檔案字串所述,您不應將連接物件傳遞給 dask。您需要傳遞與 sqlalchemy 兼容的連接字串
df = ddf.read_sql_table('cnpj_dados_cadastrais_pj',
'sqlite:////kaggle/input/amostraCNPJ.sqlite', index_col='cnpj')
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/463252.html
