主頁 > 後端開發 > MVO優化DBSCAN實作聚類

MVO優化DBSCAN實作聚類

2020-11-03 22:56:57 後端開發

目錄

一、MVO

1.基本概念

2.演算法原理

3.演算法的優缺點

4.演算法流程

二、DBSCAN

1.基本概念

2.演算法原理

3.演算法的優缺點

4.演算法流程

5.引數設定

6.MATLAB代碼

三、MVO優化DBSCAN實作聚類

參考文獻


一、MVO

1.基本概念

MVO演算法的思想啟發于物理學中多元宇宙理論,通過對白/黑洞(宇宙)和蟲洞等概念及其相互作用機理的數學化描述實作待優化問題的求解,

白洞:是一個只發射不吸收的特殊天體,并且是誕生一個宇宙的主要成分;

黑洞:剛好與白洞相反,它吸引宇宙中一切事物,所有的物理定律在黑洞中都會失效;

蟲洞:連結白洞和黑洞的多維時空隧道,將個體傳送到宇宙的任意角落,甚至是從一個宇宙到另一個宇宙,而多元宇宙通過白洞、黑洞、蟲洞相互作用達到一個穩定狀態,

2.演算法原理

MVO演算法依據多元宇宙理論的3個主要概念:白洞、黑洞和蟲洞來建立數學模型,定義候選解為宇宙,候選解的適應度為宇宙的膨脹率,迭代程序中,每一個候選解為黑洞,適應度好的宇宙依輪盤賭原理成為白洞,黑洞和白洞交換物質(維度更換),部分黑洞可以通過蟲洞鏈接穿越到最優宇宙附近(群體最優附近搜索),

3.演算法的優缺點

3.1優點

主要的性能引數是蟲洞存在概率和蟲洞旅行距離率,引數相對較少,低維度數值實驗表現出了相對較優異的性能,

3.2缺點

求解大規模優化問題的性能較差,演算法缺乏跳出區域極值的能力,導致無法尋取全域最優解,

4.演算法流程

用MVO演算法的偽代碼描述其流程如下:

Create random universes (U)
Initialize WER,TDR,Best_universe
SU=Sorted universes 
NI=Normalize inflation rate (fitness) of the universes
while the end criterion is not satisfied
      Update WEP and TDR; 
      Evaluate the fitness of all universes 
      for each universe indexed by i 
          Black_hole_index=i;
          for each object indexed  by  j 
              r1=random([0,1]);
              if r1<NI(Ui) 
                 White_hole_index=RouletteWheelSelection(-NI); 
                 U(Black_hole_index,j)=SU(White_hole_index,j); 
              end if

              r2=random([0,1]); 
              if r2<Wormhole_existance_probability 
                    r3= random([0,1]); 
                    r4= random([0,1]); 
                    if  r3<0.5         
                        U(i,j)=Best_universe(j)+Travelling_distance_rate*(( ub(j) -lb(j))*r4 + lb(j)); 
                    else   
                        U(i,j)=Best_universe(j)-Travelling_distance_rate*(( ub(j) -lb(j))*r4+lb(j));
                    end if 
              end if
          end for 
      end for
end while

有關MVO演算法的詳細介紹請參考:(中文版)MVO演算法詳解及其偽代碼


二、DBSCAN

1.基本概念

DBSCAN是一種基于密度的聚類演算法,它有兩個重要的引數:Eps為定義密度時的領域半徑,MinPts為定義核心點時的閾值,

(1) 核心點:在半徑Eps內含有大于或者等于MinPts數目的點 ,

(2) 邊界點:在半徑Eps內點的數量小于MinPts,但是落在核心點的鄰域內 ,

(3) 噪音點:既不是核心點也不是邊界點的點,

圖1 核心點、邊界點、噪音點

(4) 密度直達:若\large x_{j}位于核心點\large x_{i}的Eps領域內,則稱\large x_{j}\large x_{i}密度直達,

(5) 密度可達:對\large x_{j}\large x_{i},若存在序列\large p_{1},p_{2},...,p_{n},其中\large p_{1}=x_{i},p_{n}=x_{j}\large p_{i+1}\large p_{i}密度直達,則稱\large x_{j}\large x_{i}密度可達,

(6) 密度相連:對\large x_{j}\large x_{i},若存在\large x_{k},使得\large x_{j}\large x_{i}均由\large x_{k}密度可達,則稱\large x_{j}\large x_{i}密度相連,

圖2 密度直達、密度可達、密度相連

如圖2所示,虛線代表的是Eps領域,\large x_{1}~\large x_{5}均為核心點,\large x_{2}\large x_{4}分別由\large x_{1}密度直達,\large x_{3}\large x_{5}分別由\large x_{1}密度可達,\large x_{3}\large x_{5}密度相連,

2.演算法原理

演算法先根據引數Eps和MinPts找出所有核心點,然后以任一核心點為出發點,找出由其密度可達的樣本生成聚類簇,直到所有核心點均被訪問過為止,

3.演算法的優缺點

3.1優點

(1)不需要事先指定聚類的類別數;

(2)可以發現任意形狀的類;

(3)能找出資料中的噪音點,且對噪音點不敏感,

3.2缺點

(1)演算法的聚類效果依賴于距離公式的選取,由于高維資料存在維數災難,會對距離的度量標準產生影響;

(2)當資料集中的資料密度不均勻時,引數Eps和MinPts的選取較困難,從而影響聚類的效果,

4.演算法流程

圖3 DBSCAN演算法流程圖

5.引數設定

(1)Eps:DBSCAN演算法原文中通過定義K-距離圖選擇Eps的值,K-距離圖的定義:給定k鄰域引數,對于資料中的每個點,計算對應的第k個最近鄰域距離,并將資料集所有點對應的第k個最近鄰域距離按照降序方式排序,并繪制成降序排列的k距離圖,在K-距離圖中第一個谷值點位置對應的k距離值設定為DBSCAN的Eps,能得到較好的聚類效果,

說明:一般將K-距離圖中引數k的值設為4,

(2)MinPts:該引數的選取有一個準則,MinPts≥dim+1,其中dim表示待聚類資料的維度,

MinPts設定為1時,每個獨立點都是核心點,都可以形成一個簇;MinPts≤2時,與層次距離最近鄰域結果相同,因此,MinPts必須選擇大于等于3的值,

6.MATLAB代碼

%%% 用DBSCAN實作聚類
clear;
close all;
clc;
tic;
%% 待聚類資料集
% 第一組資料
mu1=[0 0];  %均值
S1=[0.1 0;0 0.1];  %協方差
data1=mvnrnd(mu1,S1,100);   %產生高斯分布資料
%第二組資料
mu2=[1.25 1.25];
S2=[0.1 0;0 0.1];
data2=mvnrnd(mu2,S2,100);
% 第三組資料
mu3=[-1.25 1.25];
S3=[0.1 0;0 0.1];
data3=mvnrnd(mu3,S3,100);
data=[data1;data2;data3];

%%
% KNN k distance graph, to determine the epsilon
% 對每個資料求第K個最近領域距離,一般將k值設為4.
numData=size(data,1);
Kdist=zeros(numData,1);
[~,Dist]=knnsearch(data(2:numData,:),data(1,:),'dist','euclidean','k',4);
Kdist(1)=Dist(1);
for i=2:numData
    [~,Dist] = knnsearch(data([1:i-1,i+1:numData],:),data(i,:));   % 除i行以外的其他行與i進行計算.
    Kdist(i)=Dist;        % 矩陣Dist與k的個數有關,大小始終為(1*K).
end
[sortKdist,~]=sort(Kdist,'descend');% 將資料集所有點對應的最近領域距離按照降序方式排列,sortKdist是降序排列后的資料.
distX=(1:numData)';

%% 畫圖
figure(1);
plot(distX,sortKdist,'r+-','LineWidth',2);
grid on;
% 將引數和資料代入DBSCAN函式
epsilon=0.2;
MinPts=  4   ;
labels=DBSCAN(data,epsilon,MinPts);

figure(2);
PlotClusterinResult(data, labels);
title(['DBSCAN Clustering (\epsilon = ' num2str(epsilon) ', MinPts = ' num2str(MinPts) ')']);
toc;

三、MVO優化DBSCAN實作聚類

雖然可以通過定義K-距離圖選擇Eps的值,但該方法本身的k值也需要人為設定,導致Eps的值得不到較好的選取,針對Eps值的選取問題,本博客通過MVO優化DBSCAN實作聚類,利用MVO的尋優性能找到合適的Eps值,從而使聚類效果達到最優,

MVO優化DBSCAN實作聚類的源代碼包括MVO演算法,DBSCAN演算法的源代碼,以及MVO優化DBSCAN的程序,

代碼地址:MVO-DBSCAN


參考文獻

[1]Mirjalili S, Mirjalili S M, Hatamlou A. Multi-verse optimizer: A nature-inspired algorithm for global optimization[J]. Neural Computing and Applications, 2016,27(2): 495-513.

[2]趙世杰,高雷阜,徒君等.耦合橫縱向個體更新策略的改進MVO演算法[J].控制與決策,2018,33(8):1423.

[3]來文豪,周孟然,李大同等.無監督學習AE和MVO-DBSCAN結合LIF在煤礦突水識別中的應用[J].光譜學與光譜分析,2019,39(8):2439.

[4]劉小龍.改進多元宇宙演算法求解大規模實值優化問題[J].電子與資訊學報,2019,41(7):1667.

[5]聚類方法:DBSCAN演算法研究(1)--DBSCAN原理、流程、引數設定、優缺點以及演算法

[6]聚類演算法初探(五)DBSCAN

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/201552.html

標籤:java

上一篇:Mac安裝配置Hadoop

下一篇:SCALA-DAY03(課堂代碼)

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • Rust中的智能指標:Box<T> Rc<T> Arc<T> Cell<T> RefCell<T> Weak

    Rust中的智能指標是什么 智能指標(smart pointers)是一類資料結構,是擁有資料所有權和額外功能的指標。是指標的進一步發展 指標(pointer)是一個包含記憶體地址的變數的通用概念。這個地址參考,或 ” 指向”(points at)一些其 他資料 。參考以 & 符號為標志并借用了他們所 ......

    uj5u.com 2023-04-20 07:24:10 more
  • Java的值傳遞和參考傳遞

    值傳遞不會改變本身,參考傳遞(如果傳遞的值需要實體化到堆里)如果發生修改了會改變本身。 1.基本資料型別都是值傳遞 package com.example.basic; public class Test { public static void main(String[] args) { int ......

    uj5u.com 2023-04-20 07:24:04 more
  • [2]SpinalHDL教程——Scala簡單入門

    第一個 Scala 程式 shell里面輸入 $ scala scala> 1 + 1 res0: Int = 2 scala> println("Hello World!") Hello World! 檔案形式 object HelloWorld { /* 這是我的第一個 Scala 程式 * 以 ......

    uj5u.com 2023-04-20 07:23:58 more
  • 理解函式指標和回呼函式

    理解 函式指標 指向函式的指標。比如: 理解函式指標的偽代碼 void (*p)(int type, char *data); // 定義一個函式指標p void func(int type, char *data); // 宣告一個函式func p = func; // 將指標p指向函式func ......

    uj5u.com 2023-04-20 07:23:52 more
  • Django筆記二十五之資料庫函式之日期函式

    本文首發于公眾號:Hunter后端 原文鏈接:Django筆記二十五之資料庫函式之日期函式 日期函式主要介紹兩個大類,Extract() 和 Trunc() Extract() 函式作用是提取日期,比如我們可以提取一個日期欄位的年份,月份,日等資料 Trunc() 的作用則是截取,比如 2022-0 ......

    uj5u.com 2023-04-20 07:23:45 more
  • 一天吃透JVM面試八股文

    什么是JVM? JVM,全稱Java Virtual Machine(Java虛擬機),是通過在實際的計算機上仿真模擬各種計算機功能來實作的。由一套位元組碼指令集、一組暫存器、一個堆疊、一個垃圾回收堆和一個存盤方法域等組成。JVM屏蔽了與作業系統平臺相關的資訊,使得Java程式只需要生成在Java虛擬機 ......

    uj5u.com 2023-04-20 07:23:31 more
  • 使用Java接入小程式訂閱訊息!

    更新完微信服務號的模板訊息之后,我又趕緊把微信小程式的訂閱訊息給實作了!之前我一直以為微信小程式也是要企業才能申請,沒想到小程式個人就能申請。 訊息推送平臺🔥推送下發【郵件】【短信】【微信服務號】【微信小程式】【企業微信】【釘釘】等訊息型別。 https://gitee.com/zhongfuch ......

    uj5u.com 2023-04-20 07:22:59 more
  • java -- 緩沖流、轉換流、序列化流

    緩沖流 緩沖流, 也叫高效流, 按照資料型別分類: 位元組緩沖流:BufferedInputStream,BufferedOutputStream 字符緩沖流:BufferedReader,BufferedWriter 緩沖流的基本原理,是在創建流物件時,會創建一個內置的默認大小的緩沖區陣列,通過緩沖 ......

    uj5u.com 2023-04-20 07:22:49 more
  • Java-SpringBoot-Range請求頭設定實作視頻分段傳輸

    老實說,人太懶了,現在基本都不喜歡寫筆記了,但是網上有關Range請求頭的文章都太水了 下面是抄的一段StackOverflow的代碼...自己大修改過的,寫的注釋挺全的,應該直接看得懂,就不解釋了 寫的不好...只是希望能給視頻網站開發的新手一點點幫助吧. 業務場景:視頻分段傳輸、視頻多段傳輸(理 ......

    uj5u.com 2023-04-20 07:22:42 more
  • Windows 10開發教程_編程入門自學教程_菜鳥教程-免費教程分享

    教程簡介 Windows 10開發入門教程 - 從簡單的步驟了解Windows 10開發,從基本到高級概念,包括簡介,UWP,第一個應用程式,商店,XAML控制元件,資料系結,XAML性能,自適應設計,自適應UI,自適應代碼,檔案管理,SQLite資料庫,應用程式到應用程式通信,應用程式本地化,應用程式 ......

    uj5u.com 2023-04-20 07:22:35 more