我對 glmer 模型的解釋有疑問:
我已經為模型擬合了 3 個預測變數:PA、PB 和 PC。PA和PB有兩個層次,PC(也就是動詞的位置)有3個層次(verbposition 1,verbposition 2,verbposition 3)。
使用 R 中的 contr.sum 將預測變數編碼為和對比:
constrasts(data$PA) = contr.sum(levels(data$PA)
constrasts(data$PB) = contr.sum(levels(data$PB)
constrasts(data$PC) = contr.sum(levels(data$PC)
當我運行模型時,結果顯示出各種顯著的主效應和互動作用,也與 PC 相關。但我不明白如何解釋 PC 的級別:PC1 和 PC2。
我檢查了 PC 的水平contr.sum(levels(data$PC)并得到了以下矩陣: 1: 1 0 -1 ; 2:0 1 -1
但究竟是什么說明了這一點?據我了解,PC1 包含向量 1,0,-1,PC2 包含向量 0,1,-1。似乎第 3 級是參考 - 對嗎?如果是這種情況,我該如何解釋 PC1 和 PC2 的主要影響?他們如何指代動詞 1、2 或 3?
任何幫助是極大的贊賞。
uj5u.com熱心網友回復:
這是一個mtcars資料示例。
library(dplyr)
data(mtcars)
mtcars$cyl <- as.factor(mtcars$cyl)
contrasts(mtcars$cyl) <- contr.sum(n=c("4", "6", "8"))
contrasts(mtcars$cyl)
#> [,1] [,2]
#> 4 1 0
#> 6 0 1
#> 8 -1 -1
contrasts 陳述句所說的是,第一個回歸量的系數cyl1是cyl = 4,第二個是cyl = 6并且cyl = 8由其他兩個類別的負面影響的總和表示。這里參考的不是任何一個類別,而是所有組均值的均值:下面是所有組均值,然后是組均值的均值。
mtcars %>%
group_by(cyl) %>%
summarise(mpg = mean(mpg))
#> # A tibble: 3 × 2
#> cyl mpg
#> <fct> <dbl>
#> 1 4 26.7
#> 2 6 19.7
#> 3 8 15.1
mtcars %>%
group_by(cyl) %>%
summarise(mpg = mean(mpg)) %>%
select(mpg) %>%
pull %>%
mean
#> [1] 20.50216
在模型摘要中,您可以看到組截距是均值的均值。mpg根據上面的輸出, for的平均值cyl = 4是 26.7。將cyl1系數添加到截距得到:20.5 6.2=26.7。該cyl=6組的平均值為 19.7。我們可以通過將cyl2系數添加到截距來得到這個:20.5 - .8 = 19.7。最后mpg,該cyl=8組的平均值為 15.1。我們得到這個:
20.5 -6.2 -(-.8)=15.1. 因此,我們解釋以下系數的方式是,四缸汽車的每加侖英里數比所有平均值的平均值高約 6 英里。六缸汽車預計每加侖英里數比所有平均值小約 0.8 英里。最后,八缸汽車預計每加侖英里數大約比所有組平均值低 -6.2 .8 或 5.4。
mod2 <- lm(mpg ~ cyl, data=mtcars)
summary(mod2)
#>
#> Call:
#> lm(formula = mpg ~ cyl, data = mtcars)
#>
#> Residuals:
#> Min 1Q Median 3Q Max
#> -5.2636 -1.8357 0.0286 1.3893 7.2364
#>
#> Coefficients:
#> Estimate Std. Error t value Pr(>|t|)
#> (Intercept) 20.5022 0.5935 34.543 < 2e-16 ***
#> cyl1 6.1615 0.8167 7.544 2.57e-08 ***
#> cyl2 -0.7593 0.9203 -0.825 0.416
#> ---
#> Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#>
#> Residual standard error: 3.223 on 29 degrees of freedom
#> Multiple R-squared: 0.7325, Adjusted R-squared: 0.714
#> F-statistic: 39.7 on 2 and 29 DF, p-value: 4.979e-09
由reprex 包于 2022-11-02 創建(v2.0.1)
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/525559.html
標籤:r统计数据
上一篇:emmeans:emmip_ggplot錯誤“emms$LCL中的錯誤:未為此S4類定義$運算子”
下一篇:根據需要重新標記因子水平
