我已經從 data.table 包中使用 fread 函式匯入了 ra .tsv 檔案
dt <- fread( "full_data.tsv", nrows = 1000000)
資料集有 37 列,如下所示:
| ID | DATA | lan |geo_coord |
|:----|:---------:| -----:|----------:|
|10002| 2020-02-01| eng |[10.2,32.5]|
|10003| 2020-02-01| eng |[12.2,42.5]|
|10004| 2020-02-01| eng |[14.4,22.6]|
|10005| | eng |[32.6,23.5]|
|10004| 2020-02-01| eng |[16.2,21.2]|
|10006| | eng |[16.7,20.2]|
|10007| 2020-02-01| eng | |
|10008| 2020-02-01| eng | |
|10009| 2020-02-01| eng | |
我將僅過濾地理坐標列(字符)以洗掉空單元格,從而獲得如下結果:
| ID | DATA | lan |geo_coord |
|:----|:---------:| -----:|----------:|
|10002| 2020-02-01| eng |[10.2,32.5]|
|10003| 2020-02-01| eng |[12.2,42.5]|
|10004| 2020-02-01| eng |[14.4,22.6]|
|10005| | eng |[32.6,23.5]|
|10004| 2020-02-01| eng |[16.2,21.2]|
|10006| | eng |[16.7,20.2]|
我嘗試使用來自 dplyr 的過濾器但沒有結果。
感謝您的建議或幫助!
uj5u.com熱心網友回復:
你試過了嗎
library(tidyverse)
dt %>%
filter(geo_coord != "" & !is.na(geo_coord))
似乎缺少的不是這樣編碼的,而是空字串。
uj5u.com熱心網友回復:
我們可能會使用
library(dplyr)
dt %>%
filter(complete.cases(na_if(geo_coord, "")))
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/333089.html
上一篇:R基于列資料創建箱線圖
下一篇:每次用新值替換字串中的相同模式
