主頁 >  其他 > 【網路流量識別】【聚類】【二】FCM和GMM—使用聚類技術和性能比較進行網路流量例外檢測

【網路流量識別】【聚類】【二】FCM和GMM—使用聚類技術和性能比較進行網路流量例外檢測

2021-10-19 08:31:55 其他

本文介紹采用高斯混合模型(GMM)和模糊C均值聚類(FCM)來進行網路流量例外檢測的方法,

原文來自IEEE,發表日期2013年,

原文鏈接:使用聚類技術和性能比較進行網路流量例外檢測|IEEE 會議出版物|伊 · X普洛爾

目錄

摘要

第一節:介紹

第二節:例外檢測方法

第三節:特征選擇和簡化

3.1 非負矩陣分解(NMF)

3.2 主成分分析(PCA)

第四節:聚類方法和改進

4.1 模糊高斯混合模型(GMM)

總結:


摘要

K-means聚類高斯混合模型(GMM)是有效的聚類技術,模糊聚類比硬聚類更加靈活,并且由于使用模型聚類對資料進行自然處理,因此在入侵檢測方面非常實用,模糊c均值聚類法(FCM)是一種迭代的最佳演算法,通常基于最小二乘法來劃分資料集,具有較高的計算開銷,本文建議修改目標函式和距離函式,在保持聚類精度的同時降低FCM的計算復雜性

本文提出了FCM聚類、GMM和特征變換相結合的方法,并且介紹了相關的測驗方法和聚類方法的比較,

第一節:介紹

不同的例外以不同的方式出現在網路中,因此設計一個有效的例外檢測系統需要從大量嘈雜、高維資料中提取相關資訊,區別正常和例外的網路行為的一般模型是困難的,基于模型的演算法在應用程式中也不可移植,網路流量的性質發生細微變化,模型也會不合適,因此,基于機器學習原理的非引數學習演算法是可取的,因此它們可以學習正常測量的性質,并自主的適應正常結構的變化,

例外資料檢測非常重要,因為資料中的例外轉化為各種應用領域中重要(且通常至關重要)可操作的資訊,例如,計算機網路中的例外流量模式可能意味著被黑客攻擊的計算機正在向未經授權的目的地發送敏感資料,例外 MRI 影像可能表示存在惡性腫瘤,信用卡交易資料中的例外可能表明信用卡或身份盜竊航天器傳感器的例外讀數可能表示航天器某些部件存在故障,

例外資料檢測有很多技術,比如統計學,機器學習,資料挖掘和免疫啟發技術,聚類是用于例外檢測的機器學習技術之一,它基于這樣的假設:正常資料實體屬于大型和密集的聚類,而例外不屬于任何聚類或形成非常小或獨特的聚類,模糊聚類比硬聚類更靈活,對于離群值檢測非常實用,因為它考慮到了資料的性質,傳統的FCM聚類技術的優點是可以量化元素對檢測到的聚類的隸屬度GK-FCM (古斯塔夫森-凱塞爾 FCM)可以生成適合資料形狀和位置的聚類,但是二者的計算復雜性很高,本文提出的對目標函式和距離函式的修改降低了計算復雜性,同時保持了分類的準確性,高斯混合模型(GMM)將資料分類具有指定平均值、協方差和混合比例的子類,它對簇大小的區分具有魯棒性,并且是FCM將資料實體分類為具有高斯分布的簇的一種實用方法

第二節:例外檢測方法

例外檢測的方法大概有三種:分類、光譜分析聚類

聚類根據資料相似性對資料進行分類,這些相似性可通過距離函式(如歐幾里得函式,切比雪夫函式)來測量,好的集群應該具有內部相似性相互差異性

聚類可分為兩種型別:分層聚類使用以前建立的聚類來查找連續的聚類磁區聚類根據迭代程式同時確定所有聚類基于密度的演算法,如DBSCAN(基于密度的噪聲應用空間聚類),以及基于概率模型的技術,如AutoClass和K-means聚類也逐漸流行起來,

第三節:特征選擇和簡化

通常來說,資料集中許多維度(即特征)在生成模型時沒用,為了減少演算法復雜性,縮小尺寸很重要,當特征的原始單位和意義很重要且建模目標是識別有影響的子集時特征選擇優于特征轉換,當存在絕對特征且特征轉換不恰當時,特征選擇成為減少尺寸的主要手段,

非負矩陣分解(NMF)主成分分析(PCA)是廣泛應用的特征變換技術,

3.1 非負矩陣分解(NMF)

許多維度(特征)的原始資料所包含的實際資訊可能是重疊和相互關聯的,在大多數情況下,需要進行特征選擇選擇獨立且不相關的變數,進行特征約簡以獲得其低階近似值并降低大型資料庫的計算復雜度,以及進行特征轉換以通過線性或非線性轉換組合不同的變數并形成顯著的特征

給定一個非負m*n矩陣X和正整數k<min(m, n),NMF找到非負m*k矩陣W和k*n矩陣H,使X–WH的范數最小化,因此W和H是X的近似非負因子,W的k串列示X中變數的變換;H的k行表示X中原始n個變數的線性組合的系數,這些線性組合產生W中的轉換變數,由于k<X的秩,乘積WH提供X中資料的壓縮近似值,k的可能值通常由建模的背景關系決定,

3.2 主成分分析(PCA)

主成分分析使用正交變換一組可能相關變數的觀測值轉換為一組稱為主成分的線性不相關變數值,每個主成分都是原始變數的線性組合,所有主成分相互正交,因此沒有冗余資訊,主成分的數量小于或等于原始變數的數量,此轉換的定義方式如下:主分量是空間中的單軸,將每個觀察投影到該軸上時,結果值將形成一個新變數,第二個主分量是空間中的另一個軸,垂直于第一個主分量,將觀測值投影到此軸上會生成另一個新變數,主成分分析對原始變數的相對比例敏感,

定義一個經驗平均值為零的資料矩陣XT,其中n行中的每一行表示實驗的不同重復,m列中的每一串列示特定的特征,X的奇異值分解為X=W∑VT,其中m×m矩陣W是協方差矩陣XXT的特征向量矩陣,矩陣∑是對角線上有非負實數的m×n矩形對角矩陣,n×n矩陣V是XTX的特征向量矩陣,PCA變換由:YT=XTW給出,如果我們想要一個降維表示,我們可以將X投影到僅由前L個奇異向量定義的降維空間中,∑L是一個矩形單位矩陣,X的奇異向量的矩陣W等價于觀測協方差C=X XT的矩陣的特征向量的矩陣W,

第四節:聚類方法和改進

傳統聚類方法將每個資料點分到一個簇,但模糊聚類可以分類為多個不同歸屬性的聚類,模糊聚類會生成精確的解決方案,并從某個或者一組輸入資訊中產生結果,其更加靈活,

本節介紹K-means聚類,高斯混合模型,FCM和GKFCM聚類方法,FCM和GKFCM都可以有效的生成集群,但開銷較大,然后建議對FCM進行修改(目標函式和距離函式),以簡化計算復雜性,還討論了通過非負矩陣因子化進行特征約簡和特征轉化的問題,

4.1 模糊高斯混合模型(GMM)

高斯混合模型是通過組合多變異正常密度組件而形成的,它們通常用于資料聚類,通過選擇最大化后概率的組件來分配組集,與 K 型聚類一樣,高斯混合建模使用迭次演算法,該演算法會收斂到本地最佳值,當聚類內部具有不同的大小和相關性時,高斯混合物建模可能比 k 型聚類更合適,

對于具有C聚類結構的D維資料集 x,每個聚類是高斯分布,引數μ(i),聚類 i 的密度為:

簇k的優先概率為a(k),混合密度是:

其中 x 和 μ 是 I-D 向量,Σ是一個D-D對稱的正定矩陣,我們可以根據混合密度定義新的距離函式,具體如下:

它像FCM 聚類中的物理距離一樣,具有相同的特征,因此,在距離轉換后,我們可以使用FCM程式實作基于聚類的高斯混合模型,聚類程序是一個迭次程序,以最小化目標函式,

這里m:[1, ∞]是一個權重指數,決定集群的模糊性(模糊引數);值越大,模糊性越強,如果m=1,說明資料集是不模糊的,d是在上上式子定義過的,

迭次程序與傳統 FCM 相同,使用三次重復,直到滿足標準:通常達到預先配置的閾值,

總結:

本文的方法:FCM是靈活的聚類方法,可以量化元素對檢測到的聚類的隸屬度;GK-FCM可以生成適合資料形狀和位置的聚類;二者計算復雜性很高,所以改變目標函式和距離函式降低復雜性GMM將資料分成子類,幫助FCM將資料分為具有高斯分布的簇,

有以下需要注意的知識:

(1)明白例外檢測(資料)的重要性,不僅是在計算機網路例外流量檢測,還有例外MRI影像檢測惡性腫瘤信用卡交易資料例外表明身份盜竊航天器傳感器資料例外表明部件損壞等等,

(2)聚類的假設:正常資料屬于大型和密集的聚類例外不屬于或者屬于小而獨特的聚類,模糊聚類更加靈活,對于離群值檢測很實用,因為考慮到了資料的性質,

(3)聚類原理:根據資料的相似性,采用距離函式來度量,

(4)聚類方法分類:分層聚類和磁區聚類,

——分層聚類使用根據以前建立的聚類查找連續的聚類;

——磁區聚類根據迭代程式同時確定所有聚類;

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/323330.html

標籤:其他

上一篇:CTF練習——[極客大挑戰 2019]LoveSQL1

下一篇:CTFHub-Web-SSRF練習

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more