我試圖用R找到這個樣本csv檔案中的weight列的中值。但代碼沒有回傳任何東西。問題出在哪里?
diabets <- read.csv ("https://hbiostat.org/data/repo/diabetes.csv")
中位數 (diabets$weight)
然后在找到中位數之后,我需要列印權重低于這個中位數的女性。我怎樣才能做到這一點呢?
請不要使用額外的庫。
uj5u.com熱心網友回復:
na.rm = TRUE引數將找到忽略NA的中值。
在權重中有一個NA。
sum(is. na(糖尿病$體重))
[1]/span> 1
而median(diabetes$weight, na.rm = TRUE)回傳172.5,所以,
diabetes[/span>diabetes$gender== "female" & 糖尿病$體重< 172. 5, ]
將列印權重低于這個中位數的女性。
添加
med <- median(diabetes$weight, na. rm = TRUE)。
糖尿病[(糖尿病$性別== "女性" &。 糖尿病$體重< med), 】
或者
diabetes[(diabetes$gender== "female"/span> & 糖尿病$體重<中位數(糖尿病$體重, na. rm = TRUE)), 】
uj5u.com熱心網友回復:
library(dplyr)
diabets%>%
filter(gender == "female") %>%
filter(weight < median(weight, na. rm = TRUE))
# A tibble: 123 x 19
id chol stab.glu hdl ratio glyhb location age gender height weight frame bp.1s bp.1d
<int> <int> <int> < int> <dbl> <dbl> <chr> <int> < chr> <int> < int> <chr> < int> <int>/span>
1 1000 203 82 56 3。 60 4. 31 Buckingh~ 46 女性 62 121 medi~ 118 59
2 1024 242 82 54 4。 5 4. 77 路易莎 60 女 65 156 medi~ 130 90
3 1030 238 75 36 6。 60 4. 47 路易莎 27 女 60 170 medi~ 130 80
4 1031 183 79 46 4 4。 59 路易莎 40 女 59 165 medi~ NA NA
5 1036 213 83 47 4。 5 3. 41 路易莎 33 女 65 157 medi~ 130 90
6 1271 228 66 45 5。 10 4. 61 Buckingh~ 24 女性 61 113 medi~ 100 70
7 1277 179 80 92 1。 90 4. 18 Buckingh~ 41 女性72 118 小144 112
8 1282 254 84 52 4。 90 4. 52 Buckingh~ 43 女性62 145 medi~ 125 70
9 1317 136 81 51 2。 70 4. 58 Buckingh~ 22 female 66 160 大105 85
10 1321 218 68 46 4。 70 3. 89 Buckingh~ 52 女性62 170 medi~ 142 79
# ... with 113 more rows, and 5 more variables: bp.2s <int> , bp.2d <int> , waist <int>,
# hip <int>, time.ppn <int>
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/310233.html
標籤:
上一篇:一旦POST請求內的函式被執行,Node.js將用戶重定向到另一個頁面
下一篇:用Pandas讀取CSV的錯誤
