如何使用編碼為對比度和的3級因子解釋glmer輸出-有解無憂

我對 glmer 模型的解釋有疑問：

我已經為模型擬合了 3 個預測變數：PA、PB 和 PC。PA和PB有兩個層次，PC（也就是動詞的位置）有3個層次（verbposition 1，verbposition 2，verbposition 3）。

使用 R 中的 contr.sum 將預測變數編碼為和對比：

constrasts(data$PA) = contr.sum(levels(data$PA) 
constrasts(data$PB) = contr.sum(levels(data$PB) 
constrasts(data$PC) = contr.sum(levels(data$PC)

當我運行模型時，結果顯示出各種顯著的主效應和互動作用，也與 PC 相關。但我不明白如何解釋 PC 的級別：PC1 和 PC2。

我檢查了 PC 的水平contr.sum(levels(data$PC)并得到了以下矩陣： 1: 1 0 -1 ; 2：0 1 -1

但究竟是什么說明了這一點？據我了解，PC1 包含向量 1,0,-1，PC2 包含向量 0,1,-1。似乎第 3 級是參考 - 對嗎？如果是這種情況，我該如何解釋 PC1 和 PC2 的主要影響？他們如何指代動詞 1、2 或 3？

任何幫助是極大的贊賞。

uj5u.com熱心網友回復：

這是一個mtcars資料示例。

library(dplyr)
data(mtcars)
mtcars$cyl <- as.factor(mtcars$cyl)
contrasts(mtcars$cyl) <- contr.sum(n=c("4", "6", "8"))

contrasts(mtcars$cyl) 
#>   [,1] [,2]
#> 4    1    0
#> 6    0    1
#> 8   -1   -1

contrasts 陳述句所說的是，第一個回歸量的系數cyl1是cyl = 4，第二個是cyl = 6并且cyl = 8由其他兩個類別的負面影響的總和表示。這里參考的不是任何一個類別，而是所有組均值的均值：下面是所有組均值，然后是組均值的均值。

mtcars %>% 
  group_by(cyl) %>% 
  summarise(mpg = mean(mpg))
#> # A tibble: 3 × 2
#>   cyl     mpg
#>   <fct> <dbl>
#> 1 4      26.7
#> 2 6      19.7
#> 3 8      15.1

mtcars %>% 
  group_by(cyl) %>% 
  summarise(mpg = mean(mpg)) %>% 
  select(mpg) %>% 
  pull %>% 
  mean
#> [1] 20.50216

在模型摘要中，您可以看到組截距是均值的均值。mpg根據上面的輸出， for的平均值cyl = 4是 26.7。將cyl1系數添加到截距得到：20.5 6.2=26.7。該cyl=6組的平均值為 19.7。我們可以通過將cyl2系數添加到截距來得到這個：20.5 - .8 = 19.7。最后mpg，該cyl=8組的平均值為 15.1。我們得到這個： 20.5 -6.2 -(-.8)=15.1. 因此，我們解釋以下系數的方式是，四缸汽車的每加侖英里數比所有平均值的平均值高約 6 英里。六缸汽車預計每加侖英里數比所有平均值小約 0.8 英里。最后，八缸汽車預計每加侖英里數大約比所有組平均值低 -6.2 .8 或 5.4。

mod2 <- lm(mpg ~ cyl, data=mtcars)
summary(mod2)
#> 
#> Call:
#> lm(formula = mpg ~ cyl, data = mtcars)
#> 
#> Residuals:
#>     Min      1Q  Median      3Q     Max 
#> -5.2636 -1.8357  0.0286  1.3893  7.2364 
#> 
#> Coefficients:
#>             Estimate Std. Error t value Pr(>|t|)    
#> (Intercept)  20.5022     0.5935  34.543  < 2e-16 ***
#> cyl1          6.1615     0.8167   7.544 2.57e-08 ***
#> cyl2         -0.7593     0.9203  -0.825    0.416    
#> ---
#> Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#> 
#> Residual standard error: 3.223 on 29 degrees of freedom
#> Multiple R-squared:  0.7325, Adjusted R-squared:  0.714 
#> F-statistic:  39.7 on 2 and 29 DF,  p-value: 4.979e-09

^{由reprex 包于 2022-11-02 創建(v2.0.1)}

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/525559.html

標籤：r统计数据

上一篇：emmeans:emmip_ggplot錯誤“emms$LCL中的錯誤：未為此S4類定義$運算子”

下一篇：根據需要重新標記因子水平