一個條目中更多值的累積總和-有解無憂

假設我有這個資料幀（“數字”變數也來自原始資料幀中的字符型別）：

df <- data.frame(
  id = c(1,2,2,1,2),
  number = c(30.6, "50.2/15.5", "45/58.4", 80, "57/6"))
df$number <- as.character(df$number)

現在我想為每個 ID 添加帶有累積總和的另一列，我使用df %>% mutate(csum = ave(number, id, FUN=cumsum)). 我怎么解決這個問題？

最終的資料框應該是這樣的：

df2 <- data.frame(
  id = c(1,2,2,1,2),
  number = c(30.6, "50.2/15.5", "45/58.4", 80, "57/6"),
  csum = c(30.6, "50.2/15.5", "95.2/73.9", 110.6, "152.2/79.9"))
df2

uj5u.com熱心網友回復：

一種方法可能是：

與 group_by
separate在列a和b
mutate跨越a和b和應用cumsum
unite從tidyr包使用na.rm=TRUE引數

library(dplyr)
library(tidyr)

df %>% 
  group_by(id) %>% 
  separate(number, c("a", "b"), sep="/", remove = FALSE, convert = TRUE) %>% 
  mutate(across(c(a,b), ~cumsum(.))) %>% 
  unite(csum, c(a,b), sep = '/', na.rm = TRUE)

     id number    csum      
  <dbl> <chr>     <chr>     
1     1 30.6      30.6      
2     2 50.2/15.5 50.2/15.5 
3     2 45/58.4   95.2/73.9 
4     1 80        110.6     
5     2 57/6      152.2/79.9

uj5u.com熱心網友回復：

您可以使用極快的matrixStats::colCumsums.

res <- do.call(rbind, by(df, df$id, \(x) {
  cs <- matrixStats::colCumsums(do.call(rbind, strsplit(x$number, '/')) |> 
                                  type.convert(as.is=TRUE))
  r <- do.call(paste, c(as.list(as.data.frame(cs)), sep='/'))
  data.frame(id=x$id, number=x$number, csum=r)
}))

注： R version 4.1.2 (2021-11-01)。

給出：

res
#     id    number       csum
# 1.1  1      30.6       30.6
# 1.2  1        80      110.6
# 2.1  2 50.2/15.5  50.2/15.5
# 2.2  2   45/58.4  95.2/73.9
# 2.3  2      57/6 152.2/79.9

uj5u.com熱心網友回復：

我們可以使用base R- 讀取 'number' 列將read.table其拆分為兩列，創建一個邏輯向量，其中沒有NAs，對 'd1' 行進行子集化，遍歷列，獲得累積總和 ( cumsum) and paste，然后分配它到原始資料集中的新列“csum”

d1 <- read.table(text = df$number, sep = "/", fill = TRUE, header = FALSE)
i1 <- !rowSums(is.na(d1)) > 0
df$csum[i1] <-  do.call(paste, c(lapply(d1[i1,], cumsum), sep = "/"))

-輸出

> df
  id    number       csum
1  1      30.6       <NA>
2  2 50.2/15.5  50.2/15.5
3  2   45/58.4  95.2/73.9
4  1        80       <NA>
5  2      57/6 152.2/79.9

轉載請註明出處，本文鏈接：https://www.uj5u.com/yidong/392725.html

標籤：r 数据框和累积总和

上一篇：如何僅轉置特定數量并將其添加到現有資料幀

下一篇：PySpark生成缺失的日期并用以前的值填充資料