R：在大型資料框中的多行上迭代Fisher測驗以逐行獲取輸出-有解無憂

我有一個包含多個分類值的大型資料集，這些分類值在兩個不同的組中具有不同的整數值（計數）。

舉個例子

Element <- c("zinc", "calcium", "magnesium", "sodium", "carbon", "nitrogen")
no_A <- c(45, 143, 10, 35, 70, 40)
no_B <- c(10, 11, 1, 4, 40, 30)
elements_df <- data.frame(Element, no_A, no_B)

元素	no_A	no_B
鋅	45	10
鈣	143	11
鎂	10	1
鈉	35	4
碳	70	40
氮	40	30

以前我一直在使用下面的代碼并手動更改 x 以獲取輸出值：

x = "calcium"

n1 = (elements_df %>% filter(Element== x))$no_A
n2 = sum(elements_df$no_A) - n1
n3 = (elements_df %>% filter(Element== x))$no_B
n4 = sum(elements_df$no_B) - n3

fisher.test(matrix(c(n1, n2, n3, n4), nrow = 2, ncol = 2, byrow = TRUE))

但是我有一個非常大的資料集，有 4000 行，我想要最有效的方法來遍歷所有資料并查看哪些具有顯著的 p 值。

我想我需要一個 for 回圈和函式，盡管我已經查看了一些以前的類似問題（我覺得我沒有一個可以使用）并且似乎使用 apply 可能是要走的路。

所以，簡而言之，任何人都可以幫助我撰寫在每一行中迭代 x 并列印出每個元素的相應 p 值和優勢比的代碼嗎？

uj5u.com熱心網友回復：

您可以將它們全部放在一個不錯的資料框中，如下所示：

`row.names<-`(do.call(rbind, lapply(seq(nrow(elements_df)), function(i) {
f <- fisher.test(matrix(c(elements_df$no_A[i], sum(elements_df$no_A[-i]),
                     elements_df$no_B[i], sum(elements_df$no_B[-i])), nrow = 2));
data.frame(Element = elements_df$Element[i],
           "odds ratio" = f$estimate, "p value" = scales::pvalue(f$p.value),
           "Lower CI" = f$conf.int[1], "Upper CI" = f$conf.int[2],
           check.names = FALSE)
})), NULL)

#>     Element odds ratio p value  Lower CI    Upper CI
#> 1      zinc  1.2978966   0.601 0.6122734   3.0112485
#> 2   calcium  5.5065701  <0.001 2.7976646  11.8679909
#> 3 magnesium  2.8479528   0.469 0.3961312 125.0342574
#> 4    sodium  2.6090482   0.070 0.8983185  10.3719176
#> 5    carbon  0.3599468  <0.001 0.2158107   0.6016808
#> 6  nitrogen  0.2914476  <0.001 0.1634988   0.5218564

轉載請註明出處，本文鏈接：https://www.uj5u.com/ruanti/438959.html

標籤：r 功能循环申请应用

上一篇：函式存盤在記憶體中的什么位置？

下一篇：將函式值回傳給變數