十大排序演算法-有解無憂

冒泡排序

從陣列頭開始，比較相鄰的元素，如果第一個比第二個大(小)，就交換它們兩個
對每一對相鄰元素作同樣的作業，從開始第一對到尾部的最后一對，這樣在最后的元素應該會是最大(小)的數
重復步驟1~2，重復次數等于陣列的長度，直到排序完成

代碼實作

對下面陣列實作排序：{24, 7, 43, 78, 62, 98, 82, 18, 54, 37, 73, 9}

代碼實作

public class BubbleSort {

    public static final int[] ARRAY = {24, 7, 43, 78, 62, 98, 82, 18, 54, 37, 73, 9};

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }

    public static int[] sort(int[] array) {
        if (array.length == 0) {
            return array;
        }
        for (int i = 0; i < array.length; i++) {
            //array.length - 1 -i 已經冒泡到合適位置無需在進行排序，減少比較次數
            for (int j = 0; j < array.length - 1 -i; j++) {
                //前面的數大于后面的數交換
                if (array[j + 1] < array[j]) {
                    int temp = array[j + 1];
                    array[j + 1] = array[j];
                    array[j] = temp;
                }
            }
        }
        return array;
    }

    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }
}

時間復雜度

對于上面12個資料項，從第一個元素開始，第一趟比較了11次，第二趟比較了10次，依次類推，一直到最后一趟，就是：

11 + 10 + 9 + 8 + 7 + 6 + 5  + 4 + 3  + 2 + 1  =  66次

若有n個元素，則第一趟比較為(n-1)次，第二趟比較為(n-2)次，依次類推：

(n-1) + (n-2) + (n-3) + ...+ 2 + 1 = n * (n-1)/2

在大O表示法中，去掉常數系數和低階項，該排序方式的時間復雜度為：O(n²)

演算法穩定性

假定在待排序的記錄序列中，存在多個具有相同的關鍵字的記錄，若經過排序，這些記錄的相對次序保持不變，即在原序列中，r[i]=r[j]，且r[i]在r[j]之前，而在排序后的序列中，r[i]仍在r[j]之前，則稱這種排序演算法是穩定的；否則稱為不穩定的，——百度百科

在代碼中可以看到，array[j + 1] = array[j]的時候，我們可以不移動array[i]和array[j]，所以冒泡排序是穩定的，

選擇排序

找到陣列中最大（或最小）的元素
將它和陣列的第一個元素交換位置（如果第一個元素就是最大（小）元素那么它就和自己交換）
在剩下的元素中找到最大（小）的元素，將它與陣列的第二個元素交換位置，如此往復，直到將整個陣列排序，

代碼實作

對下面陣列實作排序：{87, 23, 7, 43, 78, 62, 98, 81, 18, 53, 73, 9}

動圖演示

選擇排序

代碼實作

public class SelectionSort {

    public static final int[] ARRAY = {87, 23, 7, 43, 78, 62, 98, 81, 18, 53, 73, 9};

    public static int[] sort(int[] array) {
        if (array.length == 0) {
            return array;
        }
        for (int i = 0; i < array.length; i++) {
            //最小數的下標，每個回圈開始總是假設第一個數最小
            int minIndex = i;
            for (int j = i; j < array.length; j++) {
                //找到最小索引
                if (array[j] < array[minIndex]) {
                    //保存最小索引
                    minIndex = j;
                }
            }
            //最小索引的值
            int temp = array[minIndex];
            array[minIndex] = array[i];
            array[i] = temp;
        }
        return array;
    }

    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }
}

時間復雜度

很明顯，和冒泡排序相比，在查找最小（或最大）元素的索引，比較次數仍然保持為O(n²)

，但元素交換次數為O(n)，

演算法穩定性

選擇排序是給每個位置選擇當前元素最小的，比如給第一個位置選擇最小的，在剩余元素里面給第二個元素選擇第二小的，依次類推，直到第n-1個元素，第n個元素不用選擇了，因為只剩下它一個最大的元素了，那么，在一趟選擇，如果一個元素比當前元素小，而該小的元素又出現在一個和當前元素相等的元素后面，那么交換后穩定性就被破壞了，舉個例子，陣列5，8，5，2，9，我們知道第一遍選擇第1個元素5會和2交換，那么原序列中兩個5的相對前后順序就被破壞了，所以選擇排序是一個不穩定的排序演算法，

插入排序

當我們在玩撲克牌的時候，總是在牌堆里面抽取最頂部的一張然后按順序在手中排列，

插入排序是指在待排序的元素中，假設前面n-1(其中n>=2)個數已經是排好順序的，現將第n個數插到前面已經排好的序列中，然后找到合適自己的位置，使得插入第n個數的這個序列也是排好順序的，

對于未排序資料（一般取陣列的二個元素，把第一個元素當做有序陣列），在已排序序列中從左往右掃描，找到相應位置并插入，
為了給要插入的元素騰出空間，需要將插入位置之后的已排序元素在都向后移動一位，

代碼實作

對下面陣列實作排序：{15, 51, 86, 70, 6, 42, 26, 61, 45, 81, 17, 1}

動圖演示

插入排序

代碼實作

public class InsertionSort {

    public static final int[] ARRAY = {15, 51, 86, 70, 6, 42, 26, 61, 45, 81, 17, 1};

    public static int[] sort(int[] array) {
        if (array.length == 0) {
            return array;
        }
        //待排序資料，改資料之前的已被排序
        int current;
        for (int i = 0; i < array.length - 1; i++) {
            //已被排序資料的索引
            int index = i;
            current = array[index + 1];
            //將當前元素后移一位
            while (index >= 0 && current < array[index]) {
                array[index + 1] = array[index];
                index--;
            }
            //插入
            array[index + 1] = current;
        }
        return array;
    }


    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }
}

時間復雜度

在上面圖示中，第一趟回圈比較一次，第二趟回圈兩次，依次類推，則最后一趟比較n-1次：

1 + 2 + 3 +… + n-1 = n*(n-1)/2

也就是說，在最壞的情況下（逆序），比較的時間復雜度為O(n²)

在最優的情況下，即while循壞總是假的，只需當前數跟前一個數比較一下就可以了，這時一共需要比較n-1次，時間復雜度為O(n)，

演算法穩定性

在比較的時候，過兩個數相等的話，不會進行移動，前后兩個數的次序不會發生改變，所以插入排序是穩定的，

希爾排序

一種基于插入排序的快速的排序演算法，簡單插入排序對于大規模亂序陣列很慢，因為元素只能一點一點地從陣列的一端移動到另一端，例如，如果主鍵最小的元素正好在陣列的盡頭，要將它挪到正確的位置就需要n-1次移動，

希爾排序為了加快速度簡單地改進了插入排序，也稱為縮小增量排序，

希爾排序是把待排序陣列按一定的數量分組，對每組使用直接插入排序演算法排序；然后縮小數量繼續分組排序，隨著數量逐漸減少，每組包含的元素越來越多，當數量減至 1 時，整個陣列恰被分成一組，排序便完成了，這個不斷縮小的數量，就構成了一個增量序列，這里的數量稱為增量，

代碼實作

public class ShellSort {

    public static final int[] ARRAY = {12, 9, 6, 11, 5, 1, 14, 2, 10, 4, 8, 7, 13, 3};

    public static int[] sort(int[] array) {
        int len = array.length;
        if (len < 2) {
            return array;
        }
        //當前待排序資料，該資料之前的已被排序
        int current;
        //增量
        int gap = len / 2;
        while (gap > 0) {
            for (int i = gap; i < len; i++) {
                current = array[i];
                //前面有序序列的索引
                int index = i - gap;
                while (index >= 0 && current < array[index]) {
                    array[index + gap] = array[index];
                    //有序序列的下一個
                    index -= gap;
                }
                //插入
                array[index + gap] = current;
            }
            //int相除取整
            gap = gap / 2;
        }
        return array;
    }


    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }
}

時間復雜度

希爾排序的復雜度和增量序列有關，

在先前較大的增量下每個子序列的規模都不大,用直接插入排序效率都較高，盡管在隨后的增量遞減分組中子序列越來越大,由于整個序列的有序性也越來越明顯,則排序效率依然較高，

從理論上說，只要一個陣列是遞減的，并且最后一個值是1，都可以作為增量序列使用，有沒有一個步長序列,使得排序程序中所需的比較和移動次數相對較少,并且無論待排序列記錄數有多少,演算法的時間復雜度都能漸近最佳呢？但是目前從數學上來說，無法證明某個序列是最好的，

常用的增量序列：

希爾增量序列：{n/2, (n / 2)/2, …, 1}，其中N為原始陣列的長度，這是最常用的序列，但卻不是最好的
Hibbard序列：{2^k-1, …, 3,1}
Sedgewick序列：{… , 109 , 41 , 19 , 5，1} 運算式為9 * 4ⁱ- 9 * 2ⁱ + 1，i = 0，1，2，3，4…

演算法穩定性

由于多次插入排序，我們知道一次插入排序是穩定的，不會改變相同元素的相對順序，但在不同的插入排序程序中，相同的元素可能在各自的插入排序中移動，如陣列5，2，2，1，第一次排序第一個元素5會和第三個元素2交換，第二個元素2會和第四個元素1交換，原序列中兩個2的相對前后順序就被破壞了，所以希爾排序是一個不穩定的排序演算法，

歸并排序

歸并，指合并，合在一起，歸并排序（Merge Sort）是建立在歸并操作上的一種排序演算法，其主要思想是分而治之，什么是分而治之？分而治之就是將一個復雜的計算，按照設定的閾值進行分解成多個計算，然后將各個計算結果進行匯總，即“分”就是把一個大的通過遞回拆成若干個小的，“治”就是將分后的結果在合在一起，

若將兩個有序集合并成一個有序表，稱為2-路歸并，與之對應的還有多路歸并，

怎么分

對于排序最好的情況來講，就是只有兩個元素，這時候比較大小就很簡單，但是還是需要比較
如果拆分為左右各一個，無需比較即是有序的，

怎么治

借助一個輔助空陣列，把左右兩邊的陣列按照大小比較，按順序放入輔助陣列中即可，

以下面兩個有序陣列為例：

歸并排序

代碼實作

public class MergeSort {
    public static final int[] ARRAY = {8, 5, 6, 4, 3, 1, 7, 2};

    public static int[] sort(int[] array) {
        if (array.length < 2) return array;
        int mid = array.length / 2;
        //分成2組
        int[] left = Arrays.copyOfRange(array, 0, mid);
        int[] right = Arrays.copyOfRange(array, mid, array.length);
        //遞回拆分
        return merge(sort(left), sort(right));
    }

    //治---合并
    public static int[] merge(int[] left, int[] right) {
        int[] result = new int[left.length + right.length];
        //i代表左邊陣列的索引，j代表右邊
        for (int index = 0, i = 0, j = 0; index < result.length; index++) {
            if (i >= left.length) {//說明左側的資料已經全部取完，取右邊的資料
                result[index] = right[j++];
            } else if (j >= right.length) {//說明右側的資料已經全部取完，取左邊的資料
                result[index] = left[i++];
            } else if (left[i] > right[j]) {//左邊大于右邊，取右邊的
                int a = right[j++];
                result[index] = a;
            } else {//右邊大于左邊，取左邊的
                result[index] = left[i++];
            }
        }
        return result;
    }

    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }
}

時間復雜度

歸并排序方法就是把一組n個數的序列，折半分為兩個序列，然后再將這兩個序列再分，一直分下去，直到分為n個長度為1的序列，然后兩兩按大小歸并，如此反復，直到最后形成包含n個數的一個陣列，

歸并排序總時間 = 分解時間 + 子序列排好序時間 + 合并時間

無論每個序列有多少數都是折中分解，所以分解時間是個常數，可以忽略不計，則：

歸并排序總時間 = 子序列排好序時間 + 合并時間

假設處理的資料規模大小為 n，運行時間設為：T(n)，則T(n) = n，當 n = 1時，T(1) = 1

由于在合并時，兩個子序列已經排好序，所以在合并的時候只需要 if 判斷即可，所以n個數比較，合并的時間復雜度為 n，

將 n 個數的序列，分為兩個 n/2 的序列，則：T(n) = 2T(n/2) + n
將 n/2 個數的序列，分為四個 n/4 的序列，則：T(n) = 4T(n/4) + 2n
將 n/4 個數的序列，分為八個 n/8 的序列，則：T(n) = 8T(n/8) + 3n
…
將 n/2^k 個數的序列，分為2^k個 n/2^k 的序列，則：T(n) = 2^kT(n/2^k) + kn

當 T(n/2^k) = T(1)時，即n/2^k = 1（此時也是把n分解到只有1個資料的時候），轉換為以2為底n的對數：k = log₂ⁿ，把k帶入到T(n)中，得：T(n) = n + nlog₂ⁿ，

使用大O表示法，去掉常數項 n，省略底數 2，則歸并排序的時間復雜度為：O(nlogⁿ)

演算法穩定性

從原理分析和代碼可以看出，為在合并的時候，如果相等，選擇前面的元素到輔助陣列，所以歸并排序是穩定的，

快速排序

快速排序是對冒泡排序的一種改進，也是采用分治法的一個典型的應用，JDK中Arrays的sort()方法，具體的排序細節就是使用快速排序實作的，

從陣列中任意選取一個資料（比如陣列的第一個數或最后一個數）作為關鍵資料，我們稱為基準數(pivot，或中軸數)，然后將所有比它小的數都放到它前面，所有比它大的數都放到它后面，這個程序稱為一趟快速排序，也稱為磁區（partition）操作，

問題

若給定一個無序陣列 [8, 5, 6, 4, 3, 1, 7, 2]，并指定一個數為基準，拆分陣列使得左側的數都小于等于它，右側的數都大于它，

基準的選取最優的情況是基準值剛好取在無序區數值的中位數，這樣能夠最大效率地讓兩邊排序，同時最大地減少遞回劃分的次數，但是一般很難做到最優，基準的選取一般有三種方式：

選取陣列的第一個元素
選取陣列的最后一個元素
以及選取第一個、最后一個以及中間的元素的中位數（如4 5 6 7, 第一個4, 最后一個7, 中間的為5, 這三個數的中位數為５, 所以選擇5作為基準），

思路

隨機選擇陣列的一個元素，比如 6 為基準，拆分陣列同時引入一個初始指標，也叫磁區指示器，初始指標指向 -1
將陣列中的元素和基準數遍歷比較
若當前元素大于基準數，不做任何變化
若當前元素小于等于基準數時，分割指示器右移一位，同時
- 當前元素下標小于等于磁區指示器時，當前元素保持不動
- 當前元素下標大于磁區指示器時，當前元素和磁區指示器所指元素交換

快速排序

荷蘭國旗問題

荷蘭的國旗是由紅白藍三種顏色構成，如圖：

若現在給一個隨機的圖形，如下：

把這些條紋按照顏色排好，紅色的在上半部分，白色的在中間部分，藍色的在下半部分，這類問題稱作荷蘭國旗問題，

對應leetcode：顏色分類

給定一個包含紅色、白色和藍色，一共 n 個元素的陣列，原地對它們進行排序，使得相同顏色的元素相鄰，并按照紅色、白色、藍色順序排列，

分析：

假如給定一個陣列[8, 3, 6, 2, 5, 1, 7, 5]，做如下操作：

隨機選擇陣列的一個元素，比如 5 為基準，拆分陣列同時引入一個左磁區指示器，指向 -1，右磁區指示器指向基準數（注：此時的基準數為尾元素）
若當前元素大于基準數，右磁區指示器左移一位，當前元素和右磁區指示器所指元素交換，

索引保持不變
若當前元素小于等于基準數時，左磁區指示器右移一位，索引右移
- 當前元素大于等于左磁區指示器所指元素，當前元素保持不動
- 當前元素小于左磁區指示器所指元素，交換

簡單來說就是，左磁區指示器向右移動的程序中，如果遇到大于或等于基準數時，則停止移動，右磁區指示器向左移動的程序中，如果遇到小于或等于主元的元素則停止移動，這種操作也叫雙向快速排序，

345345

代碼實作

public class QuickSort {

    public static final int[] ARRAY = {8, 5, 6, 4, 3, 1, 7, 2};

    public static final int[] ARRAY2 = {8, 3, 6, 2, 5, 1, 7, 5};

    private static int[] sort(int[] array, int left, int right) {
        if (array.length < 1 || left > right) return null;
        //拆分
        int partitionIndex = partition(array, left, right);
        //遞回
        if (partitionIndex > left) {
            sort(array, left, partitionIndex - 1);
        }
        if (partitionIndex < right) {
            sort(array, partitionIndex + 1, right);
        }
        return array;
    }

    /**
     * 磁區快排操作
     *
     * @param array 原陣列
     * @param left  左側頭索引
     * @param right 右側尾索引
     * @return 磁區指示器  最后指向基準數
     */
    public static int partition(int[] array, int left, int right) {
        //基準數下標---隨機方式取值，也就是陣列的長度隨機1-8之間
        int pivot = (int) (left + Math.random() * (right - left + 1));
        //磁區指示器索引
        int partitionIndex = left - 1;
        //基準數和尾部元素交換
        swap(array, pivot, right);
        //按照規定，如果當前元素大于基準數不做任何操作；
        //小于基準數，磁區指示器右移，且當前元素的索引大于磁區指示器，交換
        for (int i = left; i <= right; i++) {
            if (array[i] <= array[right]) {//當前元素小于等于基準數
                partitionIndex++;
                if (i > partitionIndex) {//當前元素的索引大于磁區指示器
                    //交換
                    swap(array, i, partitionIndex);
                }
            }
        }
        return partitionIndex;
    }

    /**
     * 雙向掃描排序
     */
    public static int partitionTwoWay(int[] array, int left, int right) {
        //基準數
        int pivot = array[right];
        //左磁區指示器索引
        int leftIndex = left - 1;
        //右磁區指示器索引
        int rightIndex = right;
        //索引
        int index = left;
        while (index < rightIndex) {
            //若當前元素大于基準數，右磁區指示器左移一位，當前元素和右磁區指示器所指元素交換，索引保持不變
            if (array[index] > pivot) {
                swap(array, index, --rightIndex);
            } else if (array[index] <= pivot) {//當前元素小于等于基準數時，左分割指示器右移一位，索引右移
                leftIndex++;
                index++;
                //當前元素小于等于左磁區指示器所指元素，交換
                if (array[index] < array[leftIndex]) {
                    swap(array, index, leftIndex);
                }
            }
        }
        //索引和 L 指向同一個元素
        swap(array, right, rightIndex);
        return 1;
    }

    //交換
    private static void swap(int[] array, int i, int j) {
        int temp = array[i];
        array[i] = array[j];
        array[j] = temp;
    }


    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }


    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY, 0, ARRAY.length - 1));
        System.out.println("====================雙向排序==================");
        print(ARRAY2);
        System.out.println("============================================");
        print(sort(ARRAY2, 0, ARRAY2.length - 1));
    }
}

時間復雜度

在拆分陣列的時候可能會出現一種極端的情況，每次拆分的時候，基準數左邊的元素個數都為0，而右邊都為n-1個，這個時候，就需要拆分n次了，而每次拆分整理的時間復雜度為O(n)，所以最壞的時間復雜度為O(n²)，什么意思？舉個簡單例子：

在不知道初始序列已經有序的情況下進行排序，第1趟排序經過n-1次比較后，將第1個元素仍然定在原來的位置上，并得到一個長度為n-1的子序列；第2趟排序經過n-2次比較后，將第2個元素確定在它原來的位置上，又得到一個長度為n-2的子序列；以此類推，最終總的比較次數：

C(n) = (n-1) + (n-2) + … + 1 = n(n-1)/2

所以最壞的情況下，快速排序的時間復雜度為O(n^2)

而最好的情況就是每次拆分都能夠從陣列的中間拆分，這樣拆分logn次就行了，此時的時間復雜度為O(nlogn)，

而平均時間復雜度，則是假設每次基準數隨機，最后算出來的時間復雜度為O(nlogn)

參考：快速排序的時間復雜度與空間復雜度

演算法穩定性

通過上面的分析可以知道，在隨機取基準數的時候，資料是可能會發生變化的，所以快速排序有不是穩定的情況，

堆排序

這里的堆并不是JVM中堆疊的堆，而是一種特殊的二叉樹，通常也叫作二叉堆，它具有以下特點：

它是完全二叉樹
堆中某個結點的值總是不大于或不小于其父結點的值

知識補充

二叉樹

樹中節點的子節點不超過2的有序樹

滿二叉樹

二叉樹中除了葉子節點，每個節點的子節點都為2，則此二叉樹為滿二叉樹，

完全二叉樹

如果對滿二叉樹的結點進行編號，約定編號從根結點起，自上而下，自左而右，則深度為k的，有n個結點的二叉樹，當且僅當其每一個結點都與深度為k的滿二叉樹中編號從1至n的結點一一對應時，稱之為完全二叉樹，

特點：葉子結點只能出現在最下層和次下層，且最下層的葉子結點集中在樹的左部，需要注意的是，滿二叉樹肯定是完全二叉樹，而完全二叉樹不一定是滿二叉樹，

二叉堆

二叉堆是一種特殊的堆，可以被看做一棵完全二叉樹的陣列物件，而根據其性質又可以分為下面兩種：

大根堆：每一個根節點都大于等于它的左右孩子節點，也叫最大堆
小根堆：每一個根節點都小于等于它的左右孩子節點，也叫最小堆

如果把一個陣列通過大根堆的方式來表示（陣列元素的值是可變的），如下：

由此可以推出：

對于位置為 k 的節點，其子節點的位置分別為，左子節點 = 2k + 1，右子節點 = 2(k + 1)

如：對于 k = 1，其節點的對應陣列為 5

左子節點的位置為 3，對應陣列的值為 3

右子節點的位置為 4，對應陣列的值為 2
最后一個非葉子節點的位置為 (n/2) - 1，n為陣列長度

如：陣列長度為6，則 (6/2) - 1 = 2，即位置 2 為最后一個非葉子節點

給定一個隨機陣列[35,63,48,9,86,24,53,11]，將該陣列視為一個完全二叉樹：

從上圖很明顯的可以看出，這個二叉樹不符合大根堆的定義，但是可以通過調整，使它變為最大堆，如果從最后一個非葉子節點開始，從下到上，從右往左調整，則：

通過上面的調整，該二叉樹為最大堆，這個時候開始排序，排序規則：

將堆頂元素和尾元素交換
交換后重新調整元素的位置，使之重新變成二叉堆

代碼實作

public class HeapSort {

    public static final int[] ARRAY = {35, 63, 48, 9, 86, 24, 53, 11};

    public static int[] sort(int[] array) {
        //陣列的長度
        int length = array.length;
        if (length < 2) return array;
        //首先構建一個最大堆
        buildMaxHeap(array);
        //調整為最大堆之后，頂元素為最大元素并與微元素交換
        while (length > 0) {//當lenth <= 0時，說明已經到堆頂
            //交換
            swap(array, 0, length - 1);
            length--;//交換之后相當于把樹中的最大值彈出去了，所以要--
            //交換之后從上往下調整使之成為最大堆
            adjustHeap(array, 0, length);
        }
        return array;
    }

    //對元素組構建為一個對應陣列的最大堆
    private static void buildMaxHeap(int[] array) {
        //在之前的分析可知，最大堆的構建是從最后一個非葉子節點開始，從下往上，從右往左調整
        //最后一個非葉子節點的位置為：array.length/2 - 1
        for (int i = array.length / 2 - 1; i >= 0; i--) {
            //調整使之成為最大堆
            adjustHeap(array, i, array.length);
        }
    }

    /**
     * 調整
     * @param parent 最后一個非葉子節點
     * @param length 陣列的長度
     */
    private static void adjustHeap(int[] array, int parent, int length) {
        //定義最大值的索引
        int maxIndex = parent;
        //parent為對應元素的位置（陣列的索引）
        int left = 2 * parent + 1;//左子節點對應元素的位置
        int right = 2 * (parent + 1);//右子節點對應元素的位置
        //判斷是否有子節點，再比較父節點和左右子節點的大小
        //因為parent最后一個非葉子節點，所以如果有左右子節點則節點的位置都小于陣列的長度
        if (left < length && array[left] > array[maxIndex]) {//左子節點如果比父節點大
            maxIndex = left;
        }
        if (right < length && array[right] > array[maxIndex]) {//右子節點如果比父節點大
            maxIndex = right;
        }
        //maxIndex為父節點，若發生改變則說明不是最大節點，需要交換
        if (maxIndex != parent) {
            swap(array, maxIndex, parent);
            //交換之后遞回再次調整比較
            adjustHeap(array, maxIndex, length);
        }
    }

    //交換
    private static void swap(int[] array, int i, int j) {
        int temp = array[i];
        array[i] = array[j];
        array[j] = temp;
    }

    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }
}

時間復雜度

堆的時間復雜度是 O(nlogn)

參考：堆排序的時間復雜度分析

演算法穩定性

堆的結構為，對于位置為 k 的節點，其子節點的位置分別為，左子節點 = 2k + 1，右子節點 = 2(k + 1)，最大堆要求父節點大于等于其2個子節點，最小堆要求父節點小于等于其2個子節點，

在一個長為n的序列，堆排序的程序是從第n/2開始和其子節點共3個值選擇最大(最大堆)或者最小(最大堆)，這3個元素之間的選擇當然不會破壞穩定性，但當為n/2-1，n/2-2，… 1 這些個父節點選擇元素時，就會破壞穩定性，有可能第n/2個父節點交換把后面一個元素交換過去了，而第n/2-1個父節點把后面一個相同的元素沒有交換，那么這2個相同的元素之間的穩定性就被破壞了，所以，堆排序不是穩定的排序演算法，

參考：排序的穩定性

思考

對于快速排序來說，其平均復雜度為O(nlogn)，堆排序也是O(nlogn)，怎么選擇？如下題：

leetcode：陣列中的第K個最大元素

此題的意思是對于一個無序陣列，經過排序后的第 k 個最大的元素，

我們知道快速排序是需要對整個陣列進行排序，這樣才能取出第 k 個最大的元素，

如果使用堆排序，且是最大堆的方式，則第k次回圈即可找出第 k 個最大的元素，并不需要吧整個陣列排序，

所以對于怎么選擇的問題，要看具體的場景，或者是兩者都可，

計數排序

一種非比較排序，計數排序對一定范圍內的整數排序時候的速度非常快，一般快于其他排序演算法，但計數排序局限性比較大，只限于對整數進行排序，而且待排序元素值分布較連續、跨度小的情況，

如果一個陣列里所有元素都是整數，而且都在0-k以內，對于陣列里每個元素來說，如果能知道陣列里有多少項小于或等于該元素，就能準確地給出該元素在排序后的陣列的位置，

如給定一個0~5范圍內的陣列[2,5,3,0,2,3,0,3]，對于元素5為其中最大的元素，創建一個大小為（5-0+1 = 6）的計數陣列，如果原陣列中的值對應計數陣列的下標，則下標對應計數陣列的值加1，

問題

上面是通過陣列的最大值來確定計數陣列的長度的，但如果需要對學生的成績進行排序，如學生成績為：[95,93,92,94,92,93,95,90]，如果按照上面的方法來處理，則需要一個大小為100的陣列，但是可以看到其中的最小值為90，那也就是說前面 0~89 的位置都沒有資料存放，造成了資源浪費，

如果我們知道了陣列的最大值和最小值，則計數陣列的大小為（最大值 - 最小值 + 1），如上面陣列的最大值為99，最小值為90，則定義計數陣列的大小為（95 - 90 + 1 = 6），并且索引分別對應原陣列90_{95的值，我們把0}90的范圍用一個偏移量來表示，即最小值90就是這個偏移量，

代碼實作

public class CountSort {

    public static final int[] ARRAY = {2, 5, 3, 0, 2, 3, 0, 3};
    public static final int[] ARRAY2 = {95,93,92,94,92,93,95,90};

    //優化前
    private static int[] sort(int[] array) {
        if (array.length < 2) return array;
        //找出陣列的最大值
        int max = array[0];
        for (int i : array) {
            if (i > max) {
                max = i;
            }
        }
        //初始化一個計數陣列且值為0
        int[] countArray = new int[max + 1];
        for (int i = 0; i < countArray.length; i++) {
            countArray[i] = 0;
        }
        //填充計數陣列
        for (int temp : array) {
            countArray[temp]++;
        }
        int o_index = 0;//原陣列下標
        int n_index = 0;//計數陣列下標
        while (o_index < array.length) {
            //只要計數陣列的下標不為0，就將計數陣列的值從新寫回原陣列
            if (countArray[n_index] != 0) {
                array[o_index] = n_index;//計數陣列下標對應元素組的值
                countArray[n_index]--;//計數陣列的值要-1
                o_index++;
            } else {
                n_index++;//上一個索引的值為0后開始下一個
            }
        }
        return array;
    }

    //優化后
    private static int[] sort2(int[] array) {
        if (array.length < 2) return array;
        //找出陣列中的最大值和最小值
        int min = array[0], max = array[0];
        for (int i : array) {
            if (i > max) {
                max = i;
            }
            if (i < min) {
                min = i;
            }
        }
        //定義一個偏移量,即最小值前面0~min的范圍,這里直接用一個負數來表示
        int bias = 0 - min;
        //初始化一個計數陣列且值為0
        int[] countArray = new int[max - min + 1];
        for (int i = 0; i < countArray.length; i++) {
            countArray[i] = 0;
        }
        for (int temp : array) {
            countArray[temp + bias]++;
        }
        //填充計數陣列
        int o_index = 0;//原陣列下標
        int n_index = 0;//計數陣列下標
        while (o_index < array.length) {
            if (countArray[n_index] != 0) {
                array[o_index] = n_index - bias;
                countArray[n_index]--;
                o_index++;
            } else {
                n_index++;
            }
        }
        return array;
    }

    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
        System.out.println("=================優化排序====================");
        print(ARRAY2);
        System.out.println("============================================");
        print(sort2(ARRAY2));
    }
}

時間復雜度

很明顯，在排序程序中，我們至少遍歷了三次原始陣列，一次計數陣列，所以它的復雜度為Ο(n+m)，因此，計數排序比任何排序都要塊，這是一種犧牲空間換取時間的做法，因為排序程序中需要用一個計數陣列來存元素組的出現次數，

演算法穩定性

在新建的計數陣列中記錄原始陣列中每個元素的數量，如果原始陣列有相同的元素，則在輸出時，無法保證元素原來的排序，是一種不穩定的排序演算法，

桶排序

桶排序是計數排序的升級，計數排序可以看成每個桶只存盤相同元素，而桶排序每個桶存盤一定范圍的元素，通過函式的某種映射關系，將待排序陣列中的元素映射到各個對應的桶中，對每個桶中的元素進行排序（有可能再使用別的排序演算法或是以遞回方式繼續使用桶排序），最后將非空桶中的元素逐個放入原序列中，

桶排序需要盡量保證元素分散均勻，否則當所有資料集中在同一個桶中時，桶排序失效，

代碼實作

找出陣列中的最大值max和最小值min，可以確定出陣列所在范圍min~max
根據資料范圍確定桶的數量
- 若桶的數量太少，則桶排序失效
- 若桶的數量太多，則有的桶可能，沒有資料造成空間浪費
所以桶的數量由我們自己來確定，但盡量讓元素平均分布到每一個桶里，這里提供一個方式

(最大值 - 最小值)/每個桶所能放置多少個不同數值+1
確定桶的區間，一般是按照(最大值 - 最小值)/桶的數量來劃分的，且左閉右開

public class BucketSort {

    public static final int[] ARRAY = {35, 23, 48, 9, 16, 24, 5, 11, 32, 17};

    /**
     * @param bucketSize 作為每個桶所能放置多少個不同數值,即數值的型別
     *                   例如當BucketSize==5時，該桶可以存放｛1,2,3,4,5｝這幾種數字，
     *                   但是容量不限，即可以存放100個3
     */
    public static List<Integer> sort(List<Integer> array, int bucketSize) {
        if (array == null || array.size() < 2)
            return array;
        int max = array.get(0), min = array.get(0);
        // 找到最大值最小值
        for (int i = 0; i < array.size(); i++) {
            if (array.get(i) > max)
                max = array.get(i);
            if (array.get(i) < min)
                min = array.get(i);
        }
        //獲取桶的數量
        int bucketCount = (max - min) / bucketSize + 1;
        //構建桶，初始化
        List<ArrayList<Integer>> bucketArr = new ArrayList<>(bucketCount);
        List<Integer> resultArr = new ArrayList<>();
        for (int i = 0; i < bucketCount; i++) {
            bucketArr.add(new ArrayList<>());
        }
        //將原陣列的資料分配到桶中
        for (int i = 0; i < array.size(); i++) {
            //區間范圍
            bucketArr.get((array.get(i) - min) / bucketSize).add(array.get(i));
        }

        for (int i = 0; i < bucketCount; i++) {
            if (bucketSize == 1) {
                for (int j = 0; j < bucketArr.get(i).size(); j++)
                    resultArr.add(bucketArr.get(i).get(j));
            } else {
                if (bucketCount == 1)
                    bucketSize--;
                //對桶中的資料再次用桶進行排序
                List<Integer> temp = sort(bucketArr.get(i), bucketSize);
                for (int j = 0; j < temp.size(); j++)
                    resultArr.add(temp.get(j));
            }
        }
        return resultArr;
    }

    public static void print(List<Integer> array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(Arrays.stream(ARRAY).boxed().collect(Collectors.toList()));
        System.out.println("============================================");
        print(sort(Arrays.stream(ARRAY).boxed().collect(Collectors.toList()), 2));
    }
}

時間復雜度

桶排序演算法遍歷了2次原始陣列，運算量為2N，最后，遍歷桶輸出排序結果的運算量為N，初始化桶的運算量為M，

對桶進行排序，不同的排序演算法演算法復雜度不同，冒泡排序演算法復雜度為O(N^2)，堆排序、歸并排序演算法復雜度為O(NlogN)，我們以排序演算法復雜度為O(NlogN)進行計算，運算量為N/M * log(N/M) * M

最終的運算量為3N+M+N/M * log(N/M) * M，即3N+M+N(logN-logM)，去掉系數，時間復雜度為O(N+M+N(logN-logM))

參考：桶排序演算法詳解

演算法穩定性

桶排序演算法在對每個桶進行排序時，若選擇穩定的排序演算法，則排序后，相同元素的位置不會發生改變，所以桶排序演算法是一種穩定的排序演算法，

基數排序

常見的資料元素一般是由若干位組成的，比如字串由若干字符組成，整數由若干位0~9數字組成，

基數排序按照從右往左的順序，依次將每一位都當做一次關鍵字，然后按照該關鍵字對陣列排序，同時每一輪排序都基于上輪排序后的結果；當我們將所有的位排序后，整個陣列就達到有序狀態，基數排序不是基于比較的演算法，

基數是什么意思？對于十進制整數，每一位都只可能是0~9中的某一個，總共10種可能，那10就是它的基，同理二進制數字的基為2；對于字串，如果它使用的是8位的擴展ASCII字符集，那么它的基就是256，

基數排序有兩種方法：

MSD 從高位開始進行排序
LSD 從低位開始進行排序

對于大小范圍為0~9的數的組合（若是兩位數，就是個位數和十位數的組合），于是可以準備十個桶，然后放到對應的桶里，然后再把桶里的數按照0號桶到9號桶的順序取出來即可，

代碼實作

public class RadixSort {

    public static final int[] ARRAY = {82, 50, 21, 5, 66, 48, 43, 79, 14, 37, 25};

    public static int[] sort(int[] array) {
        if (array.length < 2) return array;
        //根據最大值算出位數
        int max = array[0];
        for (int temp : array) {
            if (temp > max) {
                max = temp;
            }
        }
        //算出位數digit
        int maxDigit = 0;
        while (max != 0) {
            max /= 10;
            maxDigit++;
        }
        //創建桶并初始化
        ArrayList<ArrayList<Integer>> bucket = new ArrayList<>();
        for (int i = 0; i < 10; i++) {
            bucket.add(new ArrayList<>());
        }
        //按照從右往左的順序，依次將每一位都當做一次關鍵字，然后按照該關鍵字對陣列排序，每一輪排序都基于上輪排序后的結果
        int mold = 10;//取模運算
        int div = 1;//獲取對應位數的值
        for (int i = 0; i < maxDigit; i++, mold *= 10, div *= 10) {
            for (int j = 0; j < array.length; j++) {
                //獲取個位/十位/百位......
                int num = (array[j] % mold) / div;
                //把資料放入到對應的桶里
                bucket.get(num).add(array[j]);
            }
            //把桶中的資料重新寫回去，并把桶的元素清空，開始第二輪排序
            int index = 0;
            for (int k = 0; k < bucket.size(); k++) {
                //桶中對應的資料
                ArrayList<Integer> list = bucket.get(k);
                for (int m = 0; m < list.size(); m++) {
                    array[index++] = list.get(m);
                }
                //清除桶
                bucket.get(k).clear();
            }
        }
        return array;
    }

    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }
}

時間復雜度

計數排序演算法的時間復雜度是O(N+M)，基數排序演算法執行了k次計數排序，所以基數排序演算法的時間復雜度為O(K(N+M))，

演算法穩定性

從上面的分析可以看出，相同元素會按照順序放進固定的桶內，取出的時候也是按照順序取出來的，所以基數排序演算法是一種穩定的排序演算法，

基數排序 vs 桶排序 vs 計數排序

這三種排序演算法都利用了桶的概念，但對桶的使用方法上有明顯差異

基數排序：根據每一位的關鍵字來分配桶
桶排序：存盤一定范圍的值
計數排序：每個桶只存盤一個型別值，但是數量不限

轉載請註明出處，本文鏈接：https://www.uj5u.com/ruanti/295707.html

標籤：其他

上一篇：漫畫 | 垃圾回收實在是太垃圾了！

下一篇：面向程序與面向物件概述