主頁 > 軟體設計 > 論文閱讀 (十五):A Review on Multi-Label Learning Algorithms (2013)

論文閱讀 (十五):A Review on Multi-Label Learning Algorithms (2013)

2020-11-04 21:38:44 軟體設計

文章目錄

  • 引入
  • 1 定義及評價指標
    • 1.1 定義
      • 1.1.1 學習框架
      • 1.1.2 關鍵挑戰
      • 1.1.3 閾值校驗

引入

??論文地址:http://palm.seu.edu.cn/zhangml/files/TKDE’13.pdf
??主要內容:
??1)多標簽定義及評價指標;
??2)具體分析八種代表演算法;
??3)總結部分學習設定,

1 定義及評價指標

1.1 定義

??符號表:

符號含義
X \mathcal{X} X實體空間 R d \mathbb{R}^d Rd (或者 Z d \mathbb{Z}^d Zd)
Y \mathcal{Y} Y標簽空間 { y 1 , y 2 , ? ? , y q } \{ y_1, y_2, \cdots, y_q \} {y1?,y2?,?,yq?}
x \boldsymbol{x} x特征向量 ( x 1 , x 2 , ? ? , x d ) ? ( x ∈ X ) (x_1, x_2, \cdots, x_d)^\top (\boldsymbol{x} \in \mathcal{X}) (x1?,x2?,?,xd?)?(xX)
Y Y Y x \boldsymbol{x} x標簽集 ( Y ∈ Y Y \in \mathcal{Y} YY)
Y ˉ \bar{Y} Yˉ Y Y Y Y \mathcal{Y} Y的補集
D \mathcal{D} D多標簽訓練集 { ( x i , Y i ) ∣ 1 < i ≤ m } \{ (\boldsymbol{x}_i, Y_i) \mid1 < i \leq m\} {(xi?,Yi?)1<im}
S \mathcal{S} S多標簽測驗集 { ( x i , Y i ) ∣ 1 < i ≤ p } \{ (\boldsymbol{x}_i, Y_i) \mid1 < i \leq p\} {(xi?,Yi?)1<ip}
h ( ? ) h (\cdot) h(?)多標簽分類器 h : X → 2 Y h: \mathcal{X} \rightarrow 2^\mathcal{Y} h:X2Y h ( x ) h (\boldsymbol{x}) h(x)回傳 x \boldsymbol{x} x標簽的可能集合
f ( ? , ? ) f (\cdot, \cdot) f(?,?)實值函式 f : X × Y → R f: \mathcal{X} \times \mathcal{Y} \rightarrow \mathbb{R} f:X×YR f ( x , y ) f (\boldsymbol{x}, y) f(x,y)回傳 x \boldsymbol{x} x正確標簽的置信度
r a n k f ( ? , ? ) rank_f (\cdot, \cdot) rankf?(?,?) r a n k f ( x , y ) rank_f (\boldsymbol{x}, y) rankf?(x,y)回傳基于降序 f ( x , ? ) f (\boldsymbol{x}, \cdot) f(x,?) y y y Y \mathcal{Y} Y上的秩
t ( ? ) t (\cdot) t(?)閾值函式 t : X → R t : \mathcal{X} \rightarrow \mathbb{R} t:XR,其中 h ( x ) = { y ∣ f ( x , y ) > t ( x ) , y ∈ Y } h (\boldsymbol{x}) = \{ y \mid f (\boldsymbol{x}, y) > t (\boldsymbol{x}), y \in \mathcal{Y} \} h(x)={yf(x,y)>t(x),yY}
∣ ? ∣ \mid \cdot \mid ? A \mathcal{A} A回傳集合 A \mathcal{A} A的候選
? ? ? \llbracket \cdot\rrbracket [[?]]如果predicate π \pi π成立,回傳 1 1 1否則 0 0 0
? ( ? , ? ) \phi (\cdot, \cdot) ?(?,?)如果 y ∈ Y y \in Y yY ? ( Y , y ) \phi (Y, y) ?(Y,y)回傳 1 1 1;否則 ? 1 -1 ?1
D j \mathcal{D}_j Dj?二類訓練集 { ( x i , ? ( Y i , y j ) ) ∣ 1 ≤ i ≤ m } \{ (\boldsymbol{x}_i, \phi (Y_i, y_j)) \mid 1 \leq i \leq m \} {(xi?,?(Yi?,yj?))1im}
ψ ( ? , ? , ? ) \psi (\cdot, \cdot, \cdot) ψ(?,?,?)如果 y j ∈ Y y_j \in Y yj?Y y k ? Y y_k \notin Y yk?/?Y ψ ( Y , y j , y k ) \psi (Y, y_j, y_k) ψ(Y,yj?,yk?)回傳 1 1 1 y j ? Y y_j \notin Y yj?/?Y y k ∈ Y y_k \in Y yk?Y回傳 ? 1 -1 ?1
D j k D_{jk} Djk?二類訓練集 { ( x , ψ ( Y i , y j , y k ) ) ∣ ? ( Y i , y j ) ≠ ? ( Y i , y k ) , 1 ≤ i ≤ m } \{ (\boldsymbol{x}, \psi (Y_i, y_j, y_k)) \mid \phi (Y_i, y_j) \neq \phi (Y_i, y_k), 1 \leq i \leq m \} {(x,ψ(Yi?,yj?,yk?))?(Yi?,yj?)?=?(Yi?,yk?),1im}
σ Y ( ? ) \sigma_{\mathcal{Y}} (\cdot) σY?(?)單射函式 σ Y : 2 Y → N \sigma_\mathcal{Y}: 2^\mathcal{Y} \rightarrow \mathbb{N} σY?:2YN ( σ Y ? 1 \sigma_\mathcal{Y}^{-1} σY?1?是相應的逆函式)
D Y ? \mathcal{D}_{\mathcal{Y}}^{\dagger} DY??多類單標簽訓練集 { ( x i ) , σ Y ( Y i ) ∣ 1 ≤ i ≤ m } \{ (\boldsymbol{x}_i), \sigma_\mathcal{Y} (Y_i) \mid 1 \leq i \leq m \} {(xi?),σY?(Yi?)1im}
B \mathcal{B} B二類學習演算法 [ F B ( m , d ) \mathcal{F}_\mathcal{B} (m ,d) FB?(m,d)用于訓練; F B ′ ( d ) \mathcal{F}_\mathcal{B}' (d) FB?(d)用于測驗]
M \mathcal{M} M多類學習演算法 [ F M ( m , d , q ) \mathcal{F}_\mathcal{M} (m ,d, q) FM?(m,d,q)用于訓練; F M ′ ( d , q ) \mathcal{F}_\mathcal{M}' (d, q) FM?(d,q)用于測驗]

1.1.1 學習框架

??令 X \mathcal{X} X表示實體空間, Y \mathcal{Y} Y表示標簽空間,多標簽的任務為從訓練集 D \mathcal{D} D習得一個映射 h : X → 2 Y h: \mathcal{X} \rightarrow 2^\mathcal{Y} h:X2Y,對于任意未知標簽的實體 x \boldsymbol{x} x h ( ? ) h (\cdot) h(?)能夠為其預測標簽 h ( x ) ? Y h (\boldsymbol{x}) \subseteq \mathcal{Y} h(x)?Y
??為了描述多標簽資料集的特征,可以使用以下幾個指標:
??1)標簽基數 (label cardinality):每個樣本平均標簽數,即

L C a r d ( D ) = 1 m ∑ i = 1 m = ∣ Y i ∣ , LCard (\mathcal{D}) = \frac{1}{m} \sum_{i = 1}^m = | Y_i |, LCard(D)=m1?i=1m?=Yi???2)標簽密度 (label density):通過標簽空間中可能的標簽數量來標準化標簽基數,即

L D i v ( D ) = 1 Y ? L C a r d ( D ) , LDiv (\mathcal{D}) = \frac{1}{\mathcal{Y}} \cdot LCard (\mathcal{D}), LDiv(D)=Y1??LCard(D)??3)標簽多樣性 (label diversity):資料集中不同標簽集的數量,即

L D i v ( D ) = ∣ { Y ∣ ? x : ( x , Y ) ∈ D } ∣ . LDiv (\mathcal{D}) = | \{ Y | \exists \boldsymbol{x}: (\boldsymbol{x}, Y) \in \mathcal{D} \} |. LDiv(D)={Y?x:(x,Y)D}.標簽多樣性也能被標準化為:

P L D i v ( D ) = 1 D ? L D i v ( D ) . PLDiv (\mathcal{D}) = \frac{1}{\mathcal{D}} \cdot LDiv (\mathcal{D}). PLDiv(D)=D1??LDiv(D).??普適情況下,多標簽模型回傳一個實值函式 f : X × Y → R f: \mathcal{X} \times \mathcal{Y} \rightarrow \mathbb{R} f:X×YR,其中 f ( x , y ) f (\boldsymbol{x}, y) f(x,y)稱為 y y y x \boldsymbol{x} x可能標簽的置信度 (confidence),特別的,給定一個多標簽樣本 ( x , Y ) (\boldsymbol{x}, Y) (x,Y) f ( ? , ? ) f (\cdot, \cdot) f(?,?)對于相關標簽 y ′ ∈ Y y' \in Y yY應該輸出更大值;不相關標簽 y ′ ′ ? Y y'' \notin Y y/?Y則反之,即:

f ( x , y ′ ) > f ( x , y ′ ′ ) . f (\boldsymbol{x}, y') > f (\boldsymbol{x}, y''). f(x,y)>f(x,y).??根據實值函式 f ( ? , ? ) f (\cdot, \cdot) f(?,?)可以得到多標簽分類器 h ( ? ) h (\cdot) h(?)

h ( x ) = { y ∣ f ( x , y ) > t ( x ) , y ∈ Y } , h (\boldsymbol{x}) = \{ y | f (\boldsymbol{x}, y) > t (\boldsymbol{x}), y \in \mathcal{Y} \}, h(x)={yf(x,y)>t(x),yY},其中 t : X → R t: \mathcal{X} \rightarrow \mathbb{R} t:XR模擬一個閾值函式,以將標簽空間分為相關標簽集和不相關標簽集,

1.1.2 關鍵挑戰

??多標簽學習的關鍵挑戰在于巨大的輸出空間,即標簽集的數量會隨類標簽呈指數增長,例如,對于一個 20 20 20類的標簽空間,標簽集的可能數量將為 2 20 2^{20} 220,對此,必須利用標簽之間的相關性來進行學習,基于相關性順序 (order of correlations),現有策略分為以下三類:
??1)First-order strategy:忽略其他標簽,進行label-by-label的處理,例如將多標簽問題分解為一系列獨立的二分類問題,該策略的突出優點為簡單高效,但不能保證獲取最優結果,
??2)Second-order strategy:考慮標簽對的相關性,例如相關標簽與不相關標簽,或者任意標簽對,
??3)High-order strategy:考慮標簽之間更高級別的關系,例如將其他標簽的影響強加給每一個標簽,

1.1.3 閾值校驗

??

轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/202534.html

標籤:其他

上一篇:2020淘寶雙11自動刷喵幣腳本

下一篇:微信公眾號采集方案

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 面試突擊第一季,第二季,第三季

    第一季必考 https://www.bilibili.com/video/BV1FE411y79Y?from=search&seid=15921726601957489746 第二季分布式 https://www.bilibili.com/video/BV13f4y127ee/?spm_id_fro ......

    uj5u.com 2020-09-10 05:35:24 more
  • 第三單元作業總結

    1.前言 這應該是本學期最后一次寫作業總結了吧。總體來說,對作業的節奏也差不多掌握了,作業做起來的效率也更高了。雖然和之前的作業一樣,作業中都要用到新的知識,但是相比之前,更加懂得了如何利用工具以及資料。雖然之間卡過殼,但總體而言,這幾次作業還算完成的比較好。 2.作業程序總結 相比前兩個單元,此單 ......

    uj5u.com 2020-09-10 05:35:41 more
  • 北航OO(2020)第四單元博客作業暨課程總結博客

    北航OO(2020)第四單元博客作業暨課程總結博客 本單元作業的架構設計 在本單元中,由于UML圖具有比較清晰的樹形結構,因此我對其中需要進行查詢操作的元素進行了包裝,在樹的父節點中存盤所有孩子的參考。考慮到性能問題,我采用了快取機制,一次查詢后盡可能快取已經遍歷過的資訊,以減少遍歷次數。 本單元我 ......

    uj5u.com 2020-09-10 05:35:48 more
  • BUAA_OO_第四單元

    一、UML決議器設計 ? 先看下題目:第四單元實作一個基于JDK 8帶有效性檢查的UML(Unified Modeling Language)類圖,順序圖,狀態圖分析器 MyUmlInteraction,實際上我們要建立一個有向圖模型,UML中的物件(元素)可能與同級元素連接,也可與低級元素相連形成 ......

    uj5u.com 2020-09-10 05:35:54 more
  • 6.1邏輯運算子

    邏輯運算子 1. && 短路與 運算式1 && 運算式2 01.運算式1為true并且運算式2也為true 整體回傳為true 02.運算式1為false,將不會執行運算式2 整體回傳為false 03.只要有一個運算式為false 整體回傳為false 2. || 短路或 運算式1 || 運算式2 ......

    uj5u.com 2020-09-10 05:35:56 more
  • BUAAOO 第四單元 & 課程總結

    1. 第四單元:StarUml檔案決議 本單元采用了圖模型決議UML。 UML檔案可以抽象為圖、子圖、邊的邏輯結構。 在實作中,圖的節點包括類、介面、屬性,子圖包括狀態圖、順序圖等。 采用了三次遍歷UML元素的方法建圖,第一遍遍歷建點,第二、三次遍歷設定屬性、連邊,實作圖物件的初始化。這里借鑒了一些 ......

    uj5u.com 2020-09-10 05:36:06 more
  • 談談我對C# 多型的理解

    面向物件三要素:封裝、繼承、多型。 封裝和繼承,這兩個比較好理解,但要理解多型的話,可就稍微有點難度了。今天,我們就來講講多型的理解。 我們應該經常會看到面試題目:請談談對多型的理解。 其實呢,多型非常簡單,就一句話:呼叫同一種方法產生了不同的結果。 具體實作方式有三種。 一、多載 多載很簡單。 p ......

    uj5u.com 2020-09-10 05:36:09 more
  • Python 資料驅動工具:DDT

    背景 python 的unittest 沒有自帶資料驅動功能。 所以如果使用unittest,同時又想使用資料驅動,那么就可以使用DDT來完成。 DDT是 “Data-Driven Tests”的縮寫。 資料:http://ddt.readthedocs.io/en/latest/ 使用方法 dd. ......

    uj5u.com 2020-09-10 05:36:13 more
  • Python里面的xlrd模塊詳解

    那我就一下面積個問題對xlrd模塊進行學習一下: 1.什么是xlrd模塊? 2.為什么使用xlrd模塊? 3.怎樣使用xlrd模塊? 1.什么是xlrd模塊? ?python操作excel主要用到xlrd和xlwt這兩個庫,即xlrd是讀excel,xlwt是寫excel的庫。 今天就先來說一下xl ......

    uj5u.com 2020-09-10 05:36:28 more
  • 當我們創建HashMap時,底層到底做了什么?

    jdk1.7中的底層實作程序(底層基于陣列+鏈表) 在我們new HashMap()時,底層創建了默認長度為16的一維陣列Entry[ ] table。當我們呼叫map.put(key1,value1)方法向HashMap里添加資料的時候: 首先,呼叫key1所在類的hashCode()計算key1 ......

    uj5u.com 2020-09-10 05:36:38 more
最新发布
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:20:47 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:20:25 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:20:17 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:20:10 more
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:19:44 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:19:07 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:18:57 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:18:49 more
  • 05單件模式

    #經典的單件模式 public class Singleton { private static Singleton uniqueInstance; //一個靜態變數持有Singleton類的唯一實體。 // 其他有用的實體變數寫在這里 //構造器宣告為私有,只有Singleton可以實體化這個類! ......

    uj5u.com 2023-04-19 08:42:51 more
  • 【架構與設計】常見微服務分層架構的區別和落地實踐

    軟體工程的方方面面都遵循一個最基本的道理:沒有銀彈,架構分層模型更是如此,每一種都有各自優缺點,所以請根據不同的業務場景,并遵循簡單、可演進這兩個重要的架構原則選擇合適的架構分層模型即可。 ......

    uj5u.com 2023-04-19 08:42:41 more