如何在R的摘要輸出中查看隱藏在“其他”下的元素？-有解無憂

我正在使用以下資料集對分類資料執行聚類分析 -鏈接到資料集- 使用 R 中的以下包：

library(cluster)
library(dplyr)
library(ggplot2)
library(readr)

使用以下代碼，我可以觀察 5 個集群內的客戶端組態檔（注意：我選擇 5 個集群而不是 7 或 8 個集群，以使事情或多或少簡單）：

df.torun <- subset(df.bank, select = -c(loan, contact, day, month, duration, campaign, pdays, previous, poutcome, y))

gower_dist <- daisy(df.torun, metric = "gower")

gower_mat <- as.matrix(gower_dist)

sil_width <- c(NA)
for(i in 2:8){
  pam_fit <- pam(gower_dist, diss = TRUE, k = i)
  sil_width[i] <- pam_fit$silinfo$avg.width
}

plot(1:8, sil_width,
     xlab = "Number of clusters",
     ylab = "Silhouette width")
lines(1:8, sil_width)

k <- 5
pam_fit <- pam(gower_dist, diss = TRUE, k)
pam_results <- df.torun %>% 
  mutate(cluster = pam_fit$clustering) %>% 
  group_by(cluster) %>% 
  do(the_summary = summary(.))
pam_results$the_summary

您將能夠看到是否使用我共享的資料運行此腳本，您將獲得有關以下類別的客戶個人資料的大量資訊：年齡、作業、婚姻、教育、默認、余額和住房. 這是我為集群 1 獲得的結果的螢屏截圖：

我得到的集群 1 的結果

從上圖中可以看出，在作業欄目下，一些結果被“隱藏”在了類別（Other）下。

我的問題：我可以使用什么代碼來列出作業列中“隱藏”在（其他）下的所有單詞？

非常感謝您的幫助！

uj5u.com熱心網友回復：

您可以使用maxsum=. 例子：

d <- data.frame(x=gl(10, 5), y=rnorm(50))

summary(d)
#       x            y          
# 1      : 5   Min.   :-1.7459  
# 2      : 5   1st Qu.:-0.8480  
# 3      : 5   Median :-0.2293  
# 4      : 5   Mean   :-0.1439  
# 5      : 5   3rd Qu.: 0.4109  
# 6      : 5   Max.   : 2.5951  
# (Other):20            

summary(d, maxsum=11)
#  x           y          
# 1 :5   Min.   :-1.7459  
# 2 :5   1st Qu.:-0.8480  
# 3 :5   Median :-0.2293  
# 4 :5   Mean   :-0.1439  
# 5 :5   3rd Qu.: 0.4109  
# 6 :5   Max.   : 2.5951  
# 7 :5                    
# 8 :5                    
# 9 :5                    
# 10:5

uj5u.com熱心網友回復：

感謝@jay.sf，我找到了解決方案。我包含了maxsum=如下所示的引數（注意：我使用了 12，因為這是變數的級別數）：

pam_fit <- pam(gower_dist, diss = TRUE, k)
pam_results <- df.torun %>% 
  mutate(cluster = pam_fit$clustering) %>% 
  group_by(cluster) %>% 
  do(the_summary = summary(., maxsum = 12))
pam_results$the_summary

轉載請註明出處，本文鏈接：https://www.uj5u.com/yidong/409161.html

標籤：

上一篇：r基于另一列的累積總和，不包括多列的當前值

下一篇：為什么直方圖不起作用-R中的閃亮庫