我的資料集有兩列。第 1 列:二分變數——“是”或“否”。第 2 列:連續預測變數,范圍為 3 - 6。
在基礎 R 中,我可以通過簡單地使用 輕松地可視化此連續預測器對實作所述二分結果的概率的影響plot(outcome~predictor)。如果我這樣做,我會得到一個看起來像這樣的圖表:

我無法使用 ggplot2 復制這種型別的圖,也無法找到其他人使用在我看來是一種簡單的資料可視化方法的示例。如果有人能夠解釋我如何使用 ggplot2 生成這個圖,我將不勝感激。
uj5u.com熱心網友回復:
您可以使用geom_rect以下方法解決此問題:
首先,一些玩具資料:
x <- runif(1000)
y <- rbinom(1000,1,0.2)
df <- data.frame(x,y)
現在創建一個包含每個矩形坐標的新資料框。你需要定義如何分解軸,你可以均勻地做,使用分位數,無論如何......我選擇了一些任意值:
limits <- c(0,.3,.9,1)
現在我可以找到我想要的每個組的比例:
df$xcut <- cut(x, c(0,.3,.9,1))
df2 <- aggregate(data=df, y~xcut, mean)
df2$max <- limits[-1]
df2$min <- limits[-(length(limits))]
df2
xcut y max min
1 (0,0.3] 0.2052980 0.3 0.0
2 (0.3,0.9] 0.2128378 0.9 0.3
3 (0.9,1] 0.2358491 1.0 0.9
現在您擁有所需的一切 geom_rect
ggplot(df2) geom_rect(aes(xmin=min,xmax=max, ymin=0, ymax=y ), fill="white", col="black")
labs(y="Proportion",x="x")
scale_x_continuous(breaks=limits)

您可以調整y軸比例并添加“否”框以獲得您想要的效果,盡管這似乎有點多余。
uj5u.com熱心網友回復:
也許
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/365022.html
上一篇:我錯過了ggplot中的第二行,應該有測驗線和火車線嗎?
下一篇:帶有數字變數的顏色時間序列
