主頁 >  其他 > 演算法與資料結構(4):堆排序

演算法與資料結構(4):堆排序

2020-09-16 04:44:01 其他

堆排序(HeapSort)是最常用的排序演算法之一,這種排序演算法同時具有插入排序和歸并排序的優點,與插入排序一樣,具有空間原址性,即任何時候都只需要常數個額外的空間儲存臨時資料(對此,請大家回想一下歸并排序,隨著問題規模的越大,需要的額外空間就越大,在解決大型問題時,這是不可接受的缺點),與歸并排序一樣,具有 \(O(n*lgn)\) 的時間復雜度,

其實一句話總結,堆排序具有 \(O(1)\) 的空間復雜度,具有 \(O(n*lgn)\) 的時間復雜度,

同時,在這里需要強調一點,此文所說的堆是一種資料結構,其類似于我們上一篇文章所說的,在一些高級語言中,例如 Java 中,“堆”是一種“垃圾收集存盤機制”,這僅僅是因為 Java 的 “垃圾收集存盤機制” 最早的資料結構采用的是“堆”,因為這個系列是介紹演算法與資料結構的,所以此系列后續提到的所有“堆”,都是只一種資料結構,希望讀者在自行了解相關知識時,注意區分,

此文堆排序的完整代碼可以在我的github上查看,

如下圖所示,(二叉)堆可以被理解為一個完全二叉樹

通常情況下,我們采用陣列來存盤(雖然我們也可以采用上一篇文章中提到的樹來實作,但這必然會帶來額外的復雜度,雖然我們采用陣列實作,但在理解時請將其視為樹,查看注釋),

除了最底層外,該樹是完全充滿的,而且最底層是從左往右依次填充,表示堆的陣列應該包括兩個屬性,heap_length 和 heap_size ,其中 heap_length 表示陣列總長度,heap_size 表示有效資料個數,同時滿足 \(0 \leq heap\_size \leq length\) ,為了方便寫代碼,我們如下定義:

#define HEAP_LENGTH 20 // 陣列長度

int array_to_sort[HEAP_LENGTH + 1] = {HEAP_LENGTH, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10,
                                      20, 19, 18, 17, 16, 15, 14, 13, 12, 11};

我們將 array_to_sort[0] 解釋為 heap_size,故 array_to_sort 的實際長度應為 heap_length + 1,這樣做的目的其實是為了下文方便,給定一個節點下標 i ,那么他的父節點,左孩子和右孩子節點下標分別為:

#define PARENT(i) (i / 2)
#define LEFT(i) (2 * i)
#define RIGHT(i) (2 * i + 1)

對于大多數的計算機而言,通過將 i 的值算數左移一位,即可在一條指令內計算出 2i,將 i 的值算數右移一位,即可在一條指令內計算出 \(\lfloor \frac{i}{2} \rfloor\) ,不過在現代編譯器中,編譯器會自動將乘2與除2運算自動優化為移位操作,所以我們在寫代碼時如果需要乘除法,盡量只進行乘2與除2操作即可,

二叉堆可以分為兩種形式:最大堆最小堆,最小堆是指 除了根節點以外的其他所有節點 i 都需要滿足:

\[A[PARENT(i)] \leq A[i] \]

即某個節點的值至多與其父節點一樣小,因此堆中的最小元素存放在根節點中,并且此樹的任意子樹中,該子樹的中的所有元素的最小值也在子樹的根節點,最大堆與此正好相反,是指 除了根節點以外的所有節點 i 都有:

\[A[PARENT(i)] \geq A[i] \]

此文中采用的堆排序使用最大堆

如果我們把堆看成一棵樹,則堆中某個節點的高度為該節點到葉節點的最長簡單路徑上的邊的數量,而堆的高度為根節點的高度,

下文的代碼中,會涉及到swap函式,我們先將此函式的代碼展示一下:

// 交換陣列array的 下標i 和 下標j 對應的值
int swap(int *array, int i, int j){
    int temp;
    temp = array[i];
    array[i] = array[j];
    array[j] = temp;
    return 0;
}

維護堆

首先展示一下代碼:

// 遞回維護最大堆
int MaintainMaxHeap(int *heap, int i){
    int largest;
    int left = LEFT(i);
    int right = RIGHT(i);
    if(left <= heap[0] && heap[left] > heap[i]){
        largest = left;
    } else{
        largest = i;
    }
    if(right <= heap[0] && heap[right] > heap[largest]){
        largest = right;
    }
    if(largest != i){
        swap(heap, largest, i);
        MaintainMaxHeap(heap, largest);
    }
    return 0;
}

此函式的作用是維護最大堆的性質,函式的輸入為一個堆(陣列)heap,一個下標 i ,呼叫前,呼叫者需要保證根節點為 LEAT(i) 和 RIGHT(i) 的二叉樹都是最大堆(具體保證方法下文會闡述),此時我們需要將以下標 i 為根節點的子樹修改為最大堆(因為heap[i] 可能小于 heap[LEFT(i)] 或 heap[RIGHT(i)] ),

在代碼中,我們從 heap[i] 和 heap[LEFT(i)] 、heap[RIGHT(i)] 中選出值最大的數,將其下標儲存在 largest 中,若heap[i] 就是最大值,說明此堆已經符合最大堆的特性,無需進行其他操作;反之則將 heap[i] 與 heap[largest] 交換,交換后,下標為largest的節點是原來的 heap[i],以此節點為根節點的子樹有可能也會違反最大堆的特性,那么我們此時只需再對此節點呼叫一次 MaintainMaxHeap() 函式,如此遞回下去,完成堆的維護,

時間復雜度

對于一棵以 i 為根節點,大小為 n 的子樹,MaintainMaxHeap() 的時間消耗分為兩部分:調整 heap[i],heap[LEFT(i)],heap[RIGHT(i)] ,代價為 \(\Theta(1)\) ;若進行了交換,維護 i 節點的一個子樹的時間(時間復雜度一般指最壞情況,所以我們需要假定遞回呼叫會發生),而每一個孩子的子樹大小至多為 \(\frac{2n}{3}\) (取最壞情況,樹的底層正好半滿,即左子樹的深度正好比右子樹大1,且左子樹是一個完全二叉樹),那么,運行一次 MaintainMaxHeap() 的時間消耗為:

\[T(n) \leq T(\frac{2n}{3}) + \Theta(1) \]

由主定理可得,上述遞回式的解為 \(T(n)=O(lgn)\)

建堆

上文我們提到,在維護堆的性質時,需要保證左右子樹均為最大堆,那么最為簡單的方法就是讓整個堆都變成最大堆,這樣,如果替換了一個數,他的左右子樹必能保證為一個最大堆,

對此,我們采用自底向上的方法,把一個大小為 n 的陣列轉換為最大堆,

// 建堆
int BuildHeap(int *heap){
    int i;
    for(i = PARENT(heap[0]); i >= 1; i--){
        MaintainMaxHeap(heap, i);
    }
    return 0;
}

正確性分析

初始化:在第一次回圈以前,\(i=\lfloor \frac{n}{2} \rfloor\) ,而 \(\lfloor \frac{n + 1}{2} \rfloor\)\(\lfloor \frac{n + 2}{2} \rfloor\) ,... ,\(n\) 都是葉節點,故下標大于 i 的節點都是一個最大堆的根節點

保持:因為節點 i 的孩子節點下標均大于 i ,故以節點 i 的子節點為根節點的樹都是一個最大堆,所以我們可以對節點 i 呼叫 MaintainMaxHeap() 函式,呼叫完成后,以節點 i 為根節點的樹是一個最大堆,其他下標大于 i 的節點要么不受影響,要么在 MaintainMaxHeap() 函式中,依然保持了最大堆的性質,一次回圈結束,i 自減,此時下標大于 i 的節點都是一個最大堆的根節點

終止:回圈結束時,i==0,那么此時下標大于 0 的節點都是一個最大堆的根節點,即整個樹已經成為了一個最大堆(heap[0]中儲存的是 heap_size,不是堆中的元素,希望各位讀者不要忘記了),

時間復雜度

對于這個程序,我們可以進行簡單的估算,每次呼叫 MaintainMaxHeap() 函式,其時間復雜度不超過 \(O(lgn)\) ,MaintainMaxHeap() 函式一共被呼叫 \(O(n)\) 次,那么其時間復雜度不超過 \(O(n*lgn)\) ,這個上界雖然正確,但不夠精確,我們下面來進行一下進一步的分析(如果讀者的數學水平有限的話,可以暫時跳過下面的具體分析),

首先,對于一個含 \(n\) 個元素的堆,其高度為 \(\lfloor lgn \rfloor\) ,其中高度為 \(h\) 的節點,最多有 \(\lceil \frac{n}{2^{h+1}} \rceil\) 個(請各位讀者再仔細看一下上文的關于堆的高度的概念,之前教朋友的時候,很多人是把概念都弄錯了,從而覺得是我這個地方算錯了2333)

在一個高度為 \(h\) 的節點上運行 MaintainMaxHeap() 的時間復雜度是 \(O(h)\) ,那么 BuildHeap() 的總的時間復雜度為

\[\sum_{h=0}^{\lfloor lgn \rfloor} {\lceil \frac{n}{2^{h+1}} \rceil}O(h) = O(n \sum_{h=0}^{\lfloor lgn \rfloor} {\frac{h}{2^h}} ) \]

使用無窮級數或者數列的知識,我們可以得到:

\[\sum_{h=0}^{ \infty } {\frac{h}{2^h}} = \frac{1/2}{(1-1/2)^2} = 2 \]

那么最終的時間復雜度為:

\[O(n \sum_{h=0}^{\lfloor lgn \rfloor} {\frac{h}{2^h}} ) = O(n \sum_{h=0}^{ \infty } {\frac{h}{2^h}}) = O(2n) = O(n) \]

沒想到吧,我們居然可以在線性時間內,把一個無序陣列構造為一個最大堆

堆排序

前面鋪墊了這么多,終于進入正題了,如何進行堆排序?

// 堆排序
int HeapSort(int *heap){
    int i;
    BuildHeap(heap);
    for(i = heap[0]; i >= 1; i--){
        swap(heap, 1, heap[0]);
        heap[0] -= 1;
        MaintainMaxHeap(heap, 1);
    }
}

步驟非常簡單,首先建立一個最大堆,那么此時陣列中的最大元素就在根節點 heap[1] ,此時我們將其與 heap[heap_size] 交換,我們即可將此元素放在正確的位置(最終的排序效果為遞增),此時我們將 heap_size 減一,將剛才被選出的最大值從堆中去掉,對于此時的堆,根節點的兩個子樹依然保持著最大堆的特性,但根節點可能會違背最大堆的特性,此時我們呼叫 MaintainMaxHeap(heap, 1) 即可將其重新轉換為一個最大堆,重復此操作,直到將所有節點均從堆中去掉,那么整個陣列也就排序完成了,

時間復雜度

堆排序的第一步是建立一個最大堆,其時間復雜度我們已經在上文分析了,為 \(O(n)\)

呼叫 n 次 MaintainMaxHeap(),每次的時間復雜度為 \(O(lgn)\)

那么總的時間復雜度為 \(O(n*lgn)\)

不過此時可能就會有好奇的讀者問了,在建堆的程序中,需要呼叫 \(n\) 次,每次復雜度不超過 \(O(lgn)\) ,這不是和堆排序是一樣的嗎?為什么建堆最后算出來時間復雜度是 \(O(n)\) ,而堆排序就是 \(O(n*lgn)\) 呢?是的,關于堆排序的時間復雜度的計算我只是給了一個感性的估計方法,如果想要非常精確的計算出來的話,也是需要像建堆時那樣一步一步計算的,只是計算出來的結果也依然是 \(O(n*lgn)\) ,所以為了偷懶,我就不驗算了嘛,畢竟還是挺費時的,

注釋

前文我們提到對于堆這種資料結構,雖然我們采用陣列實作,但在理解時請將其視為樹,其實在計算機中,所有的內容都是 0-1 串,無論你是儲存了一張圖片,還是一個word檔案,他們都是 0-1 串,但為什么會有不同的呈現方式呢?其實就是對其的解釋不同,例如在 Windows 作業系統下,檔案具有一個屬性叫做后綴名,當你修改了其后綴名以后,檔案內容其實什么都沒有變化,唯一的變化是對其解釋不同了,例如對于一個 html 檔案,當你把他解釋為一個網頁時,可以使用瀏覽器打開,效果就是我們平時所看到的各種網頁,當你把他解釋為一個文本檔案時,就可以使用記事本或者其他編輯器打開,你就能查看他的源代碼,Windows 采用后綴名的方式,一是為了方便自動選擇合適的軟體打開某個檔案(當然,你是可以在每次打開時手動選擇的,但每次都手動選擇,是真的不適合我這種懶人),二是方便用戶了解檔案內容,比如當用戶看到一個后綴名為 png 的檔案時,就能知道這大概率是圖片(畢竟不能排除有人故意亂改后綴名),后綴名是 zip 時,能知道這是一個壓縮包,而在 Linux 下,系統選擇打開某個檔案的軟體時,只查看檔案開頭的一部分字串(不同的檔案格式具有不同的檔案頭,或者被稱為魔數),據此來判斷檔案格式,而后綴名的作用就只有我們上文所說的第二個作用了,

結語

本文我們詳細介紹了堆排序的相關內容,如果前面幾篇文章認真看了的話,理解起來也并不困難,如果只是想要知道堆排序怎么寫的話,似乎前面幾篇文章頁不需要看2333,畢竟主要難度還是在于時間復雜度的計算上,但如果想要深入理解演算法這個巨坑的話,建議打好數學基礎,在時間復雜度的計算上,數學基礎是很重要的,下一篇文章我們將會介紹快速排序,

原文鏈接:albertcode.info

個人博客:albertcode.info

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/53360.html

標籤:其他

上一篇:求證在GPU是Adreno(TM)505的手機上測驗場景,深度buffer是否有延遲?

下一篇:三維中目前新的技術

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more