我正在從一個有多個主要類別并且其中有多個次要類別的網站上抓取資料。我完成了抓取部分,但我不確定如何以正確的方式存盤資料,以便在將資料轉換為 DataFrame 物件時正確顯示資料。
這是我擁有的資料的細分:
主要類別串列 -> 子類別串列 -> 對應于該子類別的鏈接串列
categories = ['Cat1', 'Cat2', ...]
subcat = ['Subcat1', 'Subcat2', ...] etc
這是資料被抓取時的最終輸出。我的問題是,我怎樣才能構建一個資料框,使其最終變成這樣:
Category1 Category2
Subcat1 Link1 Subcat1 Link1
Subcat2 Link2 Subcat2 Link2
我曾考慮將資料存盤在字典串列中,并在每個字典中存盤一個子類別串列,但無法正確顯示。
uj5u.com熱心網友回復:
我認為實作這一點的最佳方法是使用多個索引。請參考https://pandas.pydata.org/docs/user_guide/advanced.html#hierarchical-indexing-multiindex
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/471989.html
