下面是movielens資料集dataframe后的結果

簡單來說,就是把一個用戶對一個電影的標簽統一到一行。不知道這怎么實作呀
uj5u.com熱心網友回復:
userid movieid 一樣的統計到一起?那其他的各項怎么辦?只保留一個?uj5u.com熱心網友回復:
不是只保留一個,是一個用戶對一個電影打的標簽統計到一起。比如第一個用戶對電影60756有三個標簽,就是把這個三個標簽統計成一行。uj5u.com熱心網友回復:
把標簽寫到哪里?uj5u.com熱心網友回復:
import pandas as pd
chengji=[[2,600100,95,100,"fe1"],[2,600100,98,99,"fe2"],[2,600100,95,98,"fe3"],[3,89774,98,97,"fe3"],[2,89774,90,96,"fe3"],[3,89774,94,93,"fe4"]]
data=https://bbs.csdn.net/topics/pd.DataFrame(chengji,columns=['userid','movid','timestamp','時','地'])
print(data.index,data.columns) #豎序列,橫標題
print("*"*50,"原始資料")
#data['綜合']=""
print(data)
data1=data.groupby(['userid','movid']) #單一分組,可用([..],[...])多列分組
data2=data1.apply(sum)
#data2.index.names=['月份','年份']
data2.drop(['userid','movid'],axis=1,inplace=True)
data2.reset_index(level=None, drop=False, inplace=True, col_level=0, col_fill="")
print(data2)
uj5u.com熱心網友回復:
謝謝 老哥問題 解決了 6啊 向老哥學習!!!!!uj5u.com熱心網友回復:
剛好找到了一個方案,本來是錯誤的案例,但卻適用于你這個
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/63832.html
