我的資料框如下所示:
| 標題 | 注釋 | 日期 |
|---|---|---|
| 帖子1 | 256 | 2021-07-19 11:48:39 |
| 后2 | 454 | 2021-07-18 22:14:41 |
| 后 3 | 452 | 2019-05-14 19:38:11 |
| 帖子 4 | 422 | 2018-06-14 16:38:12 |
| 后5 | 452 | 2017-03-04 17:18:11 |
我想制作一個折線圖,x 軸顯示年份,y 軸顯示當年發布的帖子數量(2021 年 2 個,2019 年 1 個等)
titles_values = df["title"].value_counts().sum()
fig = px.line(data_frame=df, x="time" , y=titles_values)
fig.show()
我得到的錯誤是:“Plotly Express 無法處理具有不同型別列的寬格式資料。”
我不知道如何讓它作業。
uj5u.com熱心網友回復:
這是總結資料框的一個簡單案例。df["date"].dt.year, as_index=False).size()計算每年的行數
import io
import plotly.express as px
import pandas as pd
df = pd.read_csv(io.StringIO("""title,comments,date
post1,256,2021-07-19 11:48:39
post2,454,2021-07-18 22:14:41
post3,452,2019-05-14 19:38:11
post4,422,2018-06-14 16:38:12
post5,452,2017-03-04 17:18:11"""))
df["date"] = pd.to_datetime(df["date"])
px.line(
df.groupby(df["date"].dt.year, as_index=False).size(), x="date", y="size"
).update_layout(xaxis={"type": "category"}, yaxis={"dtick":1,"rangemode":"tozero"})
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/333447.html
