我有凝視方向在列中的資料A_aoi和B_aoi以及在列中的相應的凝視持續時間A_dur和B_dur:
df <- data.frame(
id = 1:4,
A_aoi = c("C*BB*B", "C*BCCC", "B**", "C*B"),
A_dur = c("234,312,222,3456,1112,77", "12,13,14,15,11,1654", "896,45222,55", "5554,322,142"),
B_aoi = c("**ACC", "AC*", "AAA", "C*A*"),
B_dur =c("12,13,15,100,100", "1,2,3", "88,99,100", "1,2,3,4")
)
在某些情況下,有兩個或多個直接相鄰的重復(即相同型別的測量);例如,第一個A_aoi值包含字串BB,第二個值包含CCC。
我需要總結這些重復的持續時間。借助上一個問題根據另一個變數中相關值的位置匯總一個變數中字串中的值的代碼,我能夠完成此任務:
library(data.table)
calculate <- function(p, q) {
mapply(function(x, y) toString(tapply(as.numeric(x), rleid(y), sum)),
strsplit(p, ','), strsplit(q, ''))
}
aoi_cols <- grep('aoi', names(df))
dur_cols <- grep('dur', names(df))
df[dur_cols] <- Map(calculate, df[dur_cols], df[aoi_cols])
df
id A_aoi A_dur B_aoi B_dur
1 1 C*BB*B 234, 312, 3678, 1112, 77 **ACC 25, 15, 200
2 2 C*BCCC 12, 13, 14, 1680 AC* 1, 2, 3
3 3 B** 896, 45277 AAA 287
4 4 C*B 5554, 322, 142 C*A* 1, 2, 3, 4
但是:在我的實際資料中,有NA值。例如,在這個稍微修改的 中df,我NA在 column 中添加了一個值B_dur,代碼拋出了一個錯誤:
df <- data.frame(
id = 1:4,
A_aoi = c("C*BB*B", "C*BCCC", "B**", "C*B"),
A_dur = c("234,312,222,3456,1112,77", "12,13,14,15,11,1654", "896,45222,55", "5554,322,142"),
B_aoi = c("**ACC", "AC*", "AAA", "C*A*"),
B_dur =c("12,13,15,100,100", NA, "88,99,100", "1,2,3,4")
)
即使存在 ,如何完成任務NA,結果如下所示:
df
id A_aoi A_dur B_aoi B_dur
1 1 C*BB*B 234, 312, 3678, 1112, 77 **ACC 25, 15, 200
2 2 C*BCCC 12, 13, 14, 1680 AC* <NA>
3 3 B** 896, 45277 AAA 287
4 4 C*B 5554, 322, 142 C*A* 1, 2, 3, 4
uj5u.com熱心網友回復:
您可以修改該calculate函式以檢查NA值。
library(data.table)
calculate <- function(p, q) {
mapply(function(x, y) {
if(any(is.na(x))) NA
else toString(tapply(as.numeric(x), rleid(y), sum))
}, strsplit(p, ','), strsplit(q, ''))
}
df[dur_cols] <- Map(calculate, df[dur_cols], df[aoi_cols])
df
# id A_aoi A_dur B_aoi B_dur
#1 1 C*BB*B 234, 312, 3678, 1112, 77 **ACC 25, 15, 200
#2 2 C*BCCC 12, 13, 14, 1680 AC* <NA>
#3 3 B** 896, 45277 AAA 287
#4 4 C*B 5554, 322, 142 C*A* 1, 2, 3, 4
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/396286.html
