我使用以下命令將一個大型(24,000 個觀察值和 1900 個變數)資料集讀入 R:
expression_data<-read.table("data_expression_median.txt", sep="\t", header=TRUE, fill=TRUE)
當我查看我的資料時view(expression_data),當我使用拉出有限數量的行/列時expression_data[1:3,1:5],所有資料都正確顯示。此外,當我使用該命令時,expression_data[3, 1:5]它會列印列標題和實際值(這是預期結果):
Hugo_Symbol Entrez_Gene_Id MB.0362 MB.0346 MB.0386
3 CD049690 NA 5.453928 5.454185 5.501577
但是,當我嘗試使用expression_data[3,]或任何其他命令對整行進行子集化以拉出整行時,我只會得到列標題:
Hugo_Symbol Entrez_Gene_Id MB.0362 MB.0346 MB.0386
MB.0574 MB.0503 MB.0641 MB.0201 MB.0218 MB.0316 MB.0189
MB.0891 MB.0658 MB.0899 MB.0605 MB.0258 MB.0506 MB.0420
MB.0223 MB.0445 MB.0199 MB.0517 MB.0155 MB.0428 MB.0117
為什么是這樣?我究竟做錯了什么?我需要按行進行操作,因此我需要能夠訪問整行的資料。
uj5u.com熱心網友回復:
R 有列印限制,您的資料非常廣泛。expression_data[3,]擁有所有值,您可以訪問它們,只是默認情況下不會列印它們。
您可以使用列印選項,尤其是max.print讓其在控制臺中列印更多內容的選項,但 R 控制臺確實是查看數千列資料的錯誤工具。
如果您對資料框的行進行大量數學運算,您可以考慮轉換為matrix以提高效率。
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/364191.html
下一篇:根據條件值按組創建新變數
