我剛剛開始學習python,非常非常陌生。我計劃使用邏輯回歸分類來預測糖尿病的發病率。我需要下載這個資料庫(https://www.kaggle.com/uciml/pima-indians-diabetes-database/discussion)
我如何做呢?我知道我最終需要寫pd.read_csv,但整個程序是怎樣的? 我是否先把它下載到硬碟或其他地方?如果有人能一步一步地回答最明顯的細節,我將非常感激,因為我對python非常陌生。
uj5u.com熱心網友回復:
你想做的是兩個不同的動作。
首先,你應該把資料集下載到你的硬碟上。這應該不是一個問題,因為資料集相當小。
第二,你需要將資料集下載到你的硬碟上。
其次,您需要決定如何處理這些資料。潘達可能是一個不錯的選擇。請嘗試以下代碼:
import pandas as pd
file_path = "/path/to/csv/file.csv"/span>
my_dataframe = pd.read_csv(file_path)
不要忘記下載和安裝pandas模塊。這可以用 pip 或像 conda 這樣的工具來完成。請同時查看關于讀取csv檔案的pandas檔案,以執行額外的設定(https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html)。
uj5u.com熱心網友回復:
我不能在沒有登錄網站的情況下下載你想使用的資料庫,所以我可以看到他們的限制器,quotechars和那些東西。你告訴我你需要使用pandas read函式,所以我可以在這里給你附上使用該函式的Pandas手冊:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
不要忘記添加匯入行來使用它,寫上'import pandas as pd'!
最后,關于下載它,是的,你需要下載它,其建議是把它保存在與你的專案相同的路徑中,這樣你就很容易指定路徑,你現在,只要'name.csv'。如果你需要把它保存在另一個路徑中,請記住你必須在使用讀取函式時告訴它,比如'dir/to/path/name.csv'.
編輯:我剛剛看到你說的 "沒有這樣的檔案或目錄問題 "的資訊。這就是我在第二段中所說的,請記住你需要指定檔案的正確路徑。
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/333366.html
標籤:
