使用table.read在R中匯入時出現問題-有解無憂

我相信這應該是一個簡單的問題，但我似乎無法找到我做錯了什么？我正在匯入一個 .txt 檔案，它被正確決議，但是，我無法將資料框中每個單元格的內容作為字串訪問。我希望它們作為字串的原因是因為 id 喜歡創建一個包含所有值的陣列。

我添加了下面的代碼以使用完全相同的資料集重現該問題。

data <-read.delim('https://acfdata.coworks.be/cancerdrugsdb.txt',header = TRUE)
data$Targets[1]

結果：

'CDK6; CDK4; CCND1; CCND3; CDKN2A; NRAS; CCND2; SMARCA4; KRAS'

class(data$Targets[1])
'character'

想要的結果

class(data$Targets[1]) = string

我試過用各種功能匯入，也試過這個toString()功能，但它仍然是一個字符。同樣，也許有不同的方法可以做到這一點，但沒有字串我無法分開

'CDK6; CDK4; CCND1; CCND3; CDKN2A; NRAS; CCND2; SMARCA4; KRAS'

'CDK6, CDK4, CCND1, CCND3, CDKN2A, NRAS, CCND2, SMARCA4, KRAS'

任何幫助都將不勝感激。

最終，我想要多個陣列，每行都有一個條目。

再次感謝。

uj5u.com熱心網友回復：

您是否試圖將 Targets 列“拆分”為單個值？IE

library(tidyverse)

data <-read.delim('https://acfdata.coworks.be/cancerdrugsdb.txt',header = TRUE)

max_number_of_fields <- data %>%
  mutate(Targets = str_count(string = Targets, pattern = ";")) %>%
  summarise(fields = max(Targets, na.rm = TRUE))
max_number_of_fields$fields
#> [1] 68

long_df <- data %>%
  relocate(Targets, .after = last_col()) %>%
  separate(Targets, into = paste0("Target_", 1:(max_number_of_fields$fields   1))) %>%
  pivot_longer(-c(1:14),
               values_to = "Targets") %>%
  filter(!is.na(Targets)) %>%
  select(-name)
#> Warning: Expected 69 pieces. Missing pieces filled with `NA` in 283 rows [1, 2,
#> 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...].

select(long_df, c(Product, Targets))
#> # A tibble: 2,923 × 2
#>    Product     Targets
#>    <chr>       <chr>  
#>  1 Abemaciclib CDK6   
#>  2 Abemaciclib CDK4   
#>  3 Abemaciclib CCND1  
#>  4 Abemaciclib CCND3  
#>  5 Abemaciclib CDKN2A 
#>  6 Abemaciclib NRAS   
#>  7 Abemaciclib CCND2  
#>  8 Abemaciclib SMARCA4
#>  9 Abemaciclib KRAS   
#> 10 Abiraterone CYP17A1
#> # … with 2,913 more rows

^{由reprex 包于 2022-03-22 創建(v2.0.1)}

轉載請註明出處，本文鏈接：https://www.uj5u.com/yidong/446274.html

標籤：r 字符串读表

上一篇：按ID分組并保留最新日期

下一篇：在R中使用ggplot更改圖例的一部分？