我有一個包含多個變數的資料框。其中一個是連續的,另一個是分類的。
我想獲得這兩個變數之間的 wilcoxon 檢驗,這基本上是比較兩組樣本之間差異的指標。當您知道要比較哪些因素時,這真的很容易。
例如,在 Arthritis 資料集中,您有 5 個變數(下圖)
如我們所見,該變數具有Improved三個級別marked和。我們想看看患者和變數之間是否存在差異。somenonemarkednoneage
這很簡單,我們只需要使用患者的和患者的age創建兩個向量,然后應用 wilcox.test。markedagenone
但是,我想創建一個腳本,允許您p-values根據變數的選定因子自動獲取所有引數。
因此,例如,您將選擇None然后迭代變數的其他因子并存盤 p 值。
uj5u.com熱心網友回復:
實作這一點的最簡單方法可能是僅用于
stats::pairwise.wilcox.test()計算一個因子的所有成對測驗。然后只提取感興趣的結果。
multiple_wilcox <- function(response, factor) {
pairwise.wilcox.test(response, factor, p.adjust.method = "none")$p.value[, 1]
}
# By default, tests are found against the reference level
with(iris, multiple_wilcox(Sepal.Length, Species))
#> versicolor virginica
#> 8.345827e-14 6.396699e-17
# ... which can be changed with `relevel()`
with(iris, multiple_wilcox(Sepal.Length, relevel(Species, "virginica")))
#> setosa versicolor
#> 6.396699e-17 5.869006e-07
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/432738.html
上一篇:如何獲取欄位陣列中的記錄ID?
下一篇:專案未正確附加
