我有一個使用三個csv的資料集,我需要知道一個特定列(Label)中的唯一值及其數量,以便以后繪圖。在DDoS之前,它作業得非常好。我已經檢查了原始資料,一切正常。我怎樣才能解決這個問題呢?
dataset['Label'].value_counts()/code>
探針 98129
DDoS 73529
正常 68424
DoS 53616
DDoS 48413[/p>
BFA 1405
Web-Attack 192BOTNET 164
U2R 17
名稱。Label, dtype: int64
uj5u.com熱心網友回復:
看來它們的不同方式是你所不知道的,請考慮以下代碼段
import pandas as pd
labels = pd.Series(['DDoS','DDoS','DDoS'])
print(labsels.value_counts())
輸出
DDoS 3。
DDoS1
dtype: int64
它看起來確實與你的情況類似,然而當你做
時print(labs.value_counts().index)
輸出
Index(['DDoS', 'DDoS'], dtype='object')
情況說明--有DDoS和DDoS(即DDoS后面有空格),這是不同的字串。如果是這種情況,你可以使用.str.strip,如下所示
dataset['Label'].str.strip().value_counts()
注意,它將洗掉任何前導/后導的空白(如),而不僅僅是空格。
uj5u.com熱心網友回復:
也許這兩個DDoS值不一樣(某個地方有空白字符?)
你可以試著
dataset['Label'].str. strip().value_counts()
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/307651.html
標籤:
