主頁 >  其他 > 統計學習方法筆記-感知機學習方法

統計學習方法筆記-感知機學習方法

2023-05-16 20:44:39 其他

感知機(Perceptron)

1.感知機模型

1.1感知機定義

? 輸入空間$ \mathcal{X} \subseteq \mathbb{R}^n$ ,輸出空間\(\mathcal{Y}\)={+1, -1} ;

? 輸入\(x \in \mathcal{X}\)表示的實體的特征向量,對應于輸入空間的點,輸出\(y \in \mathcal{Y}\)表示的實體的類別;

由輸入空間到輸出空間的如下函式:

? f(x) = sign($ \omega \cdot x$+b)

? \(\omega\) : 權值,b : 偏置;

? \(\omega \cdot x\) : \(\omega\)和x的內積;

? sign為符號函式;

1.2感知機幾何解釋

線性方程\(\omega \cdot x + b = 0\)對應于特征空間\(\mathbb{R}^n\)中的一個超平面S,其中ω是超平面的法向量,b是超平面的截距,這個超平面將特征空間劃分為兩個部分,位于兩部分的點分別被分為正負兩類,因此,S成為分類超平面,

2.感知機學習策略

2.1資料集的線性可分性

給定一個資料集T, 如果存在某個超平面S: \(\omega \cdot x + b = 0\)能夠將資料集的正實體點和負實體點完全正確的劃分到超平面的兩側,即yi\((\omega \cdot x + b) \ge 0\),則稱資料集T為線性可分資料集,

2.2 感知機的學習策略

首先,輸入空間\(\mathbb{R}\)n 中任一點x0到超平面S的距離d:\(\frac{1}{||\omega||}|\omega \cdot x_0 + b|\)

證明如下:

在超平面S(\(\omega \cdot x + b = 0\))任選一點v1,所需公式\(\vec{v_0v_1} = ||v_0||||v_1||\cos\theta\)

? d = \(||\vec{v_0v_1}||\cos(\vec{v_0v_1}, \omega)\)

? = \(||\vec{v_0v_1}|| \frac{|\vec{v_0v_1} \cdot \omega|}{||\vec{v_0v_1}||||\omega||}\)

? = \(\frac{|(x_1 - x_0) \cdot \omega|}{||\omega||}\)

? = \(\frac{|-b - x_0\cdot \omega|}{||\omega||}\)

? = \(\frac{1}{||\omega||}|\omega \cdot x_0 + b|\)

其次,對于誤分類的資料(xi,yi)來說,\(-y_i(\omega \cdot x_i + b) > 0\),因此,誤分類點xi到超平面S的距離是\(-y_i\frac{1}{||\omega||}|\omega \cdot x_i + b|\),假設超平面S所有誤分類點的集合為M,則所有誤分類點的總距離為\(-\frac{1}{||\omega||}\sum_{x_i \in M}y_i|\omega \cdot x_i + b|\),因此可得出損失函式為\(L(\omega, b) = - \sum_{x_i \in M}y_i(\omega \cdot x_i + b)\)

2.3 感知機演算法

2.3.1原始形式(隨機梯度下降法)

輸入:訓練資料集T = {(x1, y1), (x2, y2), ....., (xN,yN)},其中\(x_i \in \mathcal{X} = \mathbb{R}^n\)\(y_i \in \mathcal{Y} = {+1, -1}, i = 1,2,...,N;\) 學習率\(\theta(0 < \theta \le 1);\)

輸出:\(\omega\),b;感知機模型\(f(x) = sign(\omega \cdot x + b),\)

程序:

? 1.選取初值ω0, b0

? 2.在訓練集中選取資料(xi, yi);

? 3.如果\(y_i(\omega \cdot x_i + b) \le0\)\(\omega \leftarrow \omega + \theta y_ix_i\)\(b \leftarrow b+\theta y_i\)

? 4.轉至2,直至訓練集中沒有誤分類點,

注:感知機學習演算法由于采取不同的初值或選取不同的誤分類點,解可以不同,

2.3.2演算法的收斂性

證明:經過有限次迭代可以得到一個將訓練資料集完全正確劃分的分離超平面及感知機模型,

為了敘述與推導,\(\hat \omega = (\omega^T,b)^T, \hat x = (x^T, 1)^T,\hat \omega \cdot \hat x = \omega \cdot x + b\)

訓練資料集T = {(x1, y1), (x2, y2), ....., (xN,yN)},其中\(x_i \in \mathcal{X} = \mathbb{R}^n\)\(y_i \in \mathcal{Y} = {+1, -1}, i = 1,2,...,N;\)

? (1)存在滿足條件\(||\hat \omega_{opt}|| = 1\)的超平面\(\hat \omega_{opt} \cdot \hat x = \omega_{opt} \cdot x + b_{opt} = 0\) 將訓練資料集完全正確分開;且存在\(\gamma > 0\), 對所有的i= 1,2,...,N,\(y_i(\hat \omega \cdot \hat x) = y_i(w_{opt} \cdot x_i + b_{opt}) \ge \gamma\)

 證明如下:

由于訓練集是線性可分的,故存在一分離超平面,不妨設改平面為\(\hat \omega \cdot \hat x = w_{opt} \cdot x_{opt} + b_{opt} = 0\),使\(||\hat \omega_{opt}|| = 1\)

于是對于所有有限的i,均有\(y_i(w_{opt} \cdot x_i + b_{opt}) > 0\)

\(\gamma > 0\),則\(\gamma = min_{i}{(y_i(\omega_{opt} \cdot x_i+b_{opt}))}\)

所以,(1)得證,

? (2)令\(R = max_{1 \le i \le N}||\hat x||\),則在\(f(x) = sign(\omega \cdot x + b)\)在訓練資料集上的誤分類次數k滿足不等式\(k \le {(\frac{R}{\gamma})}^2\)

證明:\(\hat \omega_{k} \cdot \hat \omega_{opt} \ge k\gamma\eta\),$\hat w_{k} $是第k個誤分類點實體的擴充權重向量,

\(\hat \omega_k \cdot \hat \omega_{opt} = (\hat \omega_{k-1} + \eta y_i \hat x_i)\hat \omega_{opt} \\ \ge \hat \omega_{k-1} \cdot \hat \omega_{opt} + \eta \gamma \\ = (\hat \omega_{k-2} + \eta y_i \hat x_i)\hat \omega_{opt} \\ \ge \hat \omega_{k-2} \cdot \hat \omega_{opt} + \eta \gamma \\ \ge... \\ \ge k\eta\gamma\)

證明:\(||\hat \omega_{k}||^2 \le k \eta^2R^2\)

\(||\hat \omega_k||^2 = ||\hat \omega_k||^2 + 2\eta y_i \hat \omega_{k-1} \cdot \hat x_i + \eta^2||\hat x_i|| \\ \le ||\hat \omega_{k-1}||^2 + \eta^2||\hat x_i|| \\ \le ||\hat \omega_{k-1}||^2 + \eta^2R^2 \\ \le ||\hat \omega_{k-1}||^2 + 2\eta^2R^2 \\ \le ... \\ \le k\eta^2R^2\)

由上述可得,\(k\eta\gamma \le \hat \omega_k \cdot \hat \omega_{opt} \le ||\hat \omega_k|| ||\hat \omega_{opt}|| \le \sqrt k \eta R \rightarrow k^2\gamma^2 \le k R^2 \rightarrow k \le (\frac{R}{\gamma})^2\)

定理表明,誤分類次數k是有上界的,經過有限次搜索可以找到分離超平面,即當訓練資料集線性可分時,感知機學習演算法原始形式迭代時收斂的,

2.3.3 對偶形式

輸入:訓練資料集T = {(x1, y1), (x2, y2), ....., (xN,yN)},其中\(x_i \in \mathbb{R}^n\)\(y_i \in {+1, -1}, i = 1,2,...,N;\) 學習率\(\eta(0 < \eta \le 1);\)

輸出:\(\alpha\),b;感知機模型\(f(x) = sign(\sum_{j=1}^N \alpha_j y_j x_j \cdot x + b),\)

程序:

? 1.\(\alpha \leftarrow0, b \leftarrow 0\)

? 2.在訓練集中選取資料(xi, yi);

? 3.如果\(y_i(\sum_{j=1}^N \alpha_j y_j x_j \cdot x_i + b) \le0\)\(\alpha_i \leftarrow \alpha_i + \eta\)\(b \leftarrow b+\eta y_i\)

? 4.轉至2,直至訓練集中沒有誤分類資料,

注:Gram矩陣:訓練集中實體間的內積計算并以矩陣形式存盤,該矩陣為Gram矩陣,記為\(\mathtt{G} = [x_i \cdot x_j]_{N \ast N}\)

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/552634.html

標籤:其他

上一篇:云端煉丹,算力白嫖,基于云端GPU(Colab)使用So-vits庫制作AI特朗普演唱《國際歌》

下一篇:返回列表

標籤雲
其他(159154) Python(38143) JavaScript(25431) Java(18048) C(15227) 區塊鏈(8267) C#(7972) AI(7469) 爪哇(7425) MySQL(7191) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5871) 数组(5741) R(5409) Linux(5340) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4572) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2433) ASP.NET(2403) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1975) 功能(1967) Web開發(1951) HtmlCss(1937) python-3.x(1918) C++(1917) 弹簧靴(1913) xml(1889) PostgreSQL(1877) .NETCore(1861) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 統計學習方法筆記-感知機學習方法

    感知機(Perceptron) 1.感知機模型 1.1感知機定義 ? 輸入空間$ \mathcal{X} \subseteq \mathbb{R}^n$ ,輸出空間$\mathcal{Y}$={+1, -1} ; ? 輸入$x \in \mathcal{X}$表示的實體的特征向量,對應于輸入空間的點 ......

    uj5u.com 2023-05-16 20:44:39 more
  • 云端煉丹,算力白嫖,基于云端GPU(Colab)使用So-vits庫制作AI特朗

    人工智能AI技術早已深入到人們生活的每一個角落,君不見AI孫燕姿的歌聲此起彼伏,不絕于耳,但并不是每個人都擁有一塊N卡,沒有GPU的日子總是不好過的,但是沒關系,山人有妙計,本次我們基于Google的Colab免費云端服務器來搭建深度學習環境,制作AI特朗普,讓他高唱《國際歌》。 Colab(全名C ......

    uj5u.com 2023-05-16 20:36:23 more
  • 程式員不得不了解的計算機進制轉換

    程式員不得不了解的計算機進制轉換 最近在備考軟考的軟體設計師考試,學到了關于計算機的資料表示,由于我是半路出家學的Java,導致計算機基礎知識很差,在這里記錄一下學習感受 為啥要用二進制 早期計算機的存盤介質是晶體管,晶體管根據電壓不同,只能表示2種狀態,也就是0和1 計算機使用二進制運算更加方便 ......

    uj5u.com 2023-05-16 20:35:46 more
  • Windows本地認證之NTML哈希和LM哈希

    Windows本地認證之NTML哈希和LM哈希 一、本地認證的流程 Windows的登陸密碼是儲存在系統本地的SAM檔案中的,在登陸Windows的時候,系統會將用戶輸入的密碼與 SAM檔案中的密碼進行對比,如果相同,則認證成功。 SAM檔案是位于C:\Windows\System32\config ......

    uj5u.com 2023-05-16 20:35:29 more
  • 分享一個國內可用的ChatGPT網站,免費無限制,支持AI繪畫 - AI 百曉

    背景 ChatGPT作為一種基于人工智能技術的自然語言處理工具,近期的熱度直接沸騰🌋。 作為一個AI愛好者,翻遍了各大基于ChatGPT的網站,終于找到一個免費!免登陸!手機電腦通用!國內可直接對話的ChatGPT,也有各種提供作業效率的工具供大家使用。 產品名稱 百曉生 網站地址 https:/ ......

    uj5u.com 2023-05-16 20:34:42 more
  • 淺析AIGC for MMKG

    摘要:AIGC和多模態知識圖譜(MMKG)中的知識獲取又是怎么實作的呢?他們之間有什么關聯呢? 本文分享自華為云社區《GPT-4發布,AIGC時代的多模態還能走多遠?系列之四 AIGC for MMKG》,作者:碼上開花_Lancer。 與傳統知識圖譜不同,MMKG以多模態資料作為源頭,從多方面描述 ......

    uj5u.com 2023-05-16 20:33:49 more
  • 統計學習方法筆記-感知機學習方法

    感知機(Perceptron) 1.感知機模型 1.1感知機定義 ? 輸入空間$ \mathcal{X} \subseteq \mathbb{R}^n$ ,輸出空間$\mathcal{Y}$={+1, -1} ; ? 輸入$x \in \mathcal{X}$表示的實體的特征向量,對應于輸入空間的點 ......

    uj5u.com 2023-05-16 20:20:32 more
  • 云端煉丹,算力白嫖,基于云端GPU(Colab)使用So-vits庫制作AI特朗

    人工智能AI技術早已深入到人們生活的每一個角落,君不見AI孫燕姿的歌聲此起彼伏,不絕于耳,但并不是每個人都擁有一塊N卡,沒有GPU的日子總是不好過的,但是沒關系,山人有妙計,本次我們基于Google的Colab免費云端服務器來搭建深度學習環境,制作AI特朗普,讓他高唱《國際歌》。 Colab(全名C ......

    uj5u.com 2023-05-16 20:08:59 more
  • 資料智能加持下,中小微企業告別“融資難”

    摘要:資料智能是一個跨學科的研究領域,它結合大規模資料處理、資料挖掘、機器學習、可視化等技術,為基于資料制定決策或執行任務提供有效智能支持。面對資料智能藍海,開發者該如何發力呢?賽道參與者該如何走向成功呢? 本文分享自華為云社區《讓資料應用更智能!華為云助力開發者重慶譽存打造數字金融綜合解決方案》, ......

    uj5u.com 2023-05-16 20:08:05 more
  • 資料結構之堆疊

    Stack 型別定義 堆疊是限定僅在表尾進行插入和洗掉操作的線性表,又稱為后進先出(last in first out)的線性表(LIFO結構),表尾稱為堆疊頂,表頭稱為堆疊底,不含元素則稱為空堆疊; 抽象資料型別: InitStack(&S) //構造空堆疊S DestoryStack(&S) //銷毀堆疊S ......

    uj5u.com 2023-05-16 20:06:58 more