Java常用排序算法及性能测试集合

测试报告：

Array length: 20000

bubbleSort : 573 ms

bubbleSortAdvanced : 596 ms

bubbleSortAdvanced2 : 583 ms

selectSort : 160 ms

insertSort : 76 ms

insertSortAdvanced : 59 ms

insertSortAdvanced2 : 164 ms

binaryTreeSort : 3 ms

shellSort : 2 ms

shellSortAdvanced : 2 ms

shellSortAdvanced2 : 1 ms

mergeSort : 3 ms

quickSort : 1 ms

heapSort : 2 ms

通过测试，可以认为，冒泡排序完全有理由扔进垃圾桶。它存在的唯一理由可能是最好理解。希尔排序的高效性是我没有想到的；堆排序比较难理解和编写，要有宏观的思维。

/*

* SortUtil.java

* Version 1.0.0

* Created on 2017年9月3日

* Copyright ReYo.Cn

*/

package reyo.sdk.utils.test.sort;

/**

* <B>创  建 人：</B>AdministratorReyoAut <BR>

* <B>创建时间：</B>2017年9月3日 上午7:41:36<BR>

*

* @author ReYo

* @version 1.0

*/

import java.lang.reflect.Method;

import java.util.Arrays;

import java.util.Date;

/**

 * Java常用排序算法及性能测试集合

 *

 * 本程序集合涵盖常用排序算法的编写，并在注释中配合极其简单的特例讲解了各种算法的工作原理，以方便理解和吸收；

 * 程序编写过程中吸收了很多*和别人blog上面的例子，并结合自己的思考，选择或改进一个最容易让人理解的写法。 */

public class SortUtil {

    // 被测试的方法集合

    static String[] methodNames = new String[] { "bubbleSort", "bubbleSortAdvanced", "bubbleSortAdvanced2",

            "selectSort", "insertSort", "insertSortAdvanced", "insertSortAdvanced2", "binaryTreeSort", "shellSort",

            "shellSortAdvanced", "shellSortAdvanced2", "mergeSort", "quickSort", "heapSort" };

    public static void main(String[] args) throws Exception {

        //correctnessTest();

        performanceTest(20000);

    }

    /**

     * 正确性测试<br>

     * 简单地测试一下各个算法的正确性<br>

     * 只是为了方便观测新添加的算法是否基本正确；<br>

     * @throws Exception 主要是反射相关的Exception；<br>

     */

    public static void correctnessTest() throws Exception {

        int len = 10;

        int[] a = new int[len];

        for (int i = 0; i < methodNames.length; i++) {

            for (int j = 0; j < a.length; j++) {

                a[j] = (int) Math.floor(Math.random() * len * 2);

            }

            Method sortMethod = null;

            sortMethod = SortUtil.class.getDeclaredMethod(methodNames[i], a.getClass());

            Object o = sortMethod.invoke(null, a);

            System.out.print(methodNames[i] + " : ");

            if (o == null) {

                System.out.println(Arrays.toString(a));

            } else {

                //兼顾mergeSort，它的排序结果以返回值的形式出现；

                System.out.println(Arrays.toString((int[]) o));

            }

        }

    }

    /**

     * 性能测试<br>

     * 数组长度用参数len传入，每个方法跑20遍取耗时平均值；<br>

     * @param len 数组长度 建议取10000以上，否则有些算法会显示耗时为0；<br>

     * @throws Exception 主要是反射相关的Exception；<br>

     */

    public static void performanceTest(int len) throws Exception {

        int[] a = new int[len];

        int times = 20;

        System.out.println("Array length: " + a.length);

        for (int i = 0; i < methodNames.length; i++) {

            Method sortMethod = null;

            sortMethod = SortUtil.class.getDeclaredMethod(methodNames[i], a.getClass());

            int totalTime = 0;

            for (int j = 0; j < times; j++) {

                for (int k = 0; k < len; k++) {

                    a[k] = (int) Math.floor(Math.random() * 20000);

                }

                long start = new Date().getTime();

                sortMethod.invoke(null, a);

                long end = new Date().getTime();

                totalTime += (end - start);

            }

            System.out.println(methodNames[i] + " : " + (totalTime / times) + " ms");

            //System.out.println(Arrays.toString(a));

        }

    }

    /**

     * 最原始的冒泡交换排序;<br>

     * 两层遍历，外层控制扫描的次数，内层控制比较的次数；<br>

     * 外层每扫描一次，就有一个最大的元素沉底；所以内层的比较次数将逐渐减小；<br>

     * 时间复杂度: 平均:O(n^2)，最好:O(n);最坏:O(n^2);

     * 空间复杂度: O(1);

     */

    public static void bubbleSort(int[] a) {

        for (int i = 0; i < a.length; i++) {

            for (int j = 0; j < a.length - i - 1; j++) {

                if (a[j] > a[j + 1]) {

                    int tmp = a[j];

                    a[j] = a[j + 1];

                    a[j + 1] = tmp;

                }

            }

        }

    }

    /**

     * 改进的冒泡法<br>

     * 改进之处在于：设一个标志位，如果某趟跑下来，没有发生交换，说明已经排好了；<br>

     */

    public static void bubbleSortAdvanced(int[] a) {

        int k = a.length - 1;

        boolean flag = true;

        while (flag) {

            flag = false;

            for (int i = 0; i < k; i++) {

                if (a[i] > a[i + 1]) {

                    int tmp = a[i];

                    a[i] = a[i + 1];

                    a[i + 1] = tmp;

                    //有交换则继续保持标志位；

                    flag = true;

                }

            }

            k--;

        }

    }

    /**

     * 改进的冒泡法2<br>

     * 改进之处在于吸收上面的思想(没有交换意味着已经有序)，如果局部的已经是有序的，则后续的比较就不需要再比较他们了。<br>

     * 比如：3142 5678，假如刚刚做完了2和4交换之后，发现这趟比较后续再也没有发生交换，则后续的比较只需要比到4即可；<br>

     * 该算法就是用一个标志位记录某趟最后发生比较的地点；<br>

     */

    public static void bubbleSortAdvanced2(int[] a) {

        int flag = a.length - 1;

        int k;

        while (flag > 0) {

            k = flag;

            flag = 0;

            for (int i = 0; i < k; i++) {

                if (a[i] > a[i + 1]) {

                    int tmp = a[i];

                    a[i] = a[i + 1];

                    a[i + 1] = tmp;

                    //有交换则记录该趟最后发生比较的地点；

                    flag = i + 1;

                }

            }

        }

    }

    /**

     * 插入排序

     *

     * 关于插入排序，这里有几个约定，从而可以快速理解算法：<br>

     * i: 无序表遍历下标；i<n-1；<br>

     * j: 有序表遍历下表；0<=j<i;<br>

     * a[i]:表示当前被拿出来做插入排序的无序表头元素；<br>

     * a[j]:有序表中的任意元素；<br>

     * <br>

     * 算法关键点：把数组分割为a[0~i-1]有序表，a[i~n-1]无序表；每次从无序表头部取一个，<br>

     * 把它插入到有序表适当的位置，直到无序表为空；<br>

     * 初始时，a[0]为有序表，a[1~n-1]为无序表；<br>

     *

     * 时间复杂度: 平均:O(n^2)，最好:O(n);最坏:O(n^2);

     * 空间复杂度: O(1);

     */

    public static void insertSort(int[] a) {

        //从无序表头开始遍历；

        for (int i = 1; i < a.length; i++) {

            int j;

            //拿a[i]和有序表元素依次比较，找到一个恰当的位置；

            for (j = i - 1; j >= 0; j--) {

                if (a[j] < a[i]) {

                    break;

                }

            }

            //如果找到恰当的位置，则从该位置开始，把元素朝后移动一格，为插入的元素腾出空间；

            if (j != (i - 1)) {

                int tmp = a[i];

                int k;

                for (k = i - 1; k > j; k--) {

                    a[k + 1] = a[k];

                }

                a[k + 1] = tmp;

            }

        }

    }

    /**

     * 改进的插入排序1

     * 改进的关键在于：首先拿无序表头元素a[i]和有序表尾a[i-1]比较，

     * 如果a[i]<a[i-1],说明需要调整；调整的过程为：

     * 从有序表尾开始，把有序表里面比a[i]大的元素都朝后移动，直到找到恰当的位置；

     */

    public static void insertSortAdvanced(int[] a) {

        //遍历无序表；

        for (int i = 1; i < a.length; i++) {

            //如果无序表头元素小于有序表尾，说明需要调整；

            if (a[i] < a[i - 1]) {

                int tmp = a[i];

                int j;

                //从有序表尾朝前搜索并比较，并把大于a[i]的元素朝后移动以腾出空间；

                for (j = i - 1; j >= 0 && a[j] > tmp; j--) {

                    a[j + 1] = a[j];

                }

                a[j + 1] = tmp;

            }

        }

    }

    /**

     * 改进的插入排序2

     * 总体思想和上面相似，拿无序表头元素从有序表尾元素开始朝前比较，

     * 如果a[i]比a[i-1]小，则把a[i]从有序表尾用冒泡交换的方式朝前移动，直到到达恰当的位置；

     */

    public static void insertSortAdvanced2(int[] a) {

        //遍历无序表

        for (int i = 1; i < a.length; i++) {

            //拿a[i]从有序表尾开始冒泡；

            for (int j = i - 1; j >= 0 && a[j] > a[j + 1]; j--) {//a[j+1]就是a[i]

                int tmp = a[j];

                a[j] = a[j + 1];

                a[j + 1] = tmp;

            }

        }

    }

    /**

     * 快速排序<br>

     * 算法的思想在于分而治之:先找一个元素(一般来说都是数组头元素),把比它大的都放到右边,把比它小的都放到左边;<br>

     * 然后再按照这样的思想去处理两个子数组; 下面说的子数组头元素通指用来划分数组的元素;<br>

     * <br>

     * 下面程序关键点就在于!forward, low0++, high0--这些运算; 这三个运算使得a[low0],a[high0]里面总有一个指向子数组头元素; <br>

     * 可以用极端的情况来方便理解这三个值的运作: <br>

     * 假如我的数列为0123456789, 初始时forward=false,0作为子数组划分依据,很显然第一轮的时候不会发生任何交换,low0一直指向0,<br>

     * high0逐渐下降直到它指向0为止; 同理可思考9876543210这个例子;<br>

     * <br>

     * 时间复杂度: 平均:O(nlogn)，最好:O(nlogn);最坏:O(n^2);

     * 空间复杂度: O(logn);要为递归栈提供空间

     * @param a 待排序数组<br>

     * @param low 子数组开始的下标;<br>

     * @param high 子数组结束的下标;<br>

     */

    public static void quickSort(int[] a, int low, int high) {

        if (low >= high) {

            return;

        }

        int low0 = low;

        int high0 = high;

        boolean forward = false;

        while (low0 != high0) {

            if (a[low0] > a[high0]) {

                int tmp = a[low0];

                a[low0] = a[high0];

                a[high0] = tmp;

                forward = !forward;

            }

            if (forward) {

                low0++;

            } else {

                high0--;

            }

        }

        low0--;

        high0++;

        quickSort(a, low, low0);

        quickSort(a, high0, high);

    }

    /**

     * 快速排序的简单调用形式<br>

     * 方便测试和调用<br>

     * @param a

     */

    public static void quickSort(int[] a) {

        quickSort(a, 0, a.length - 1);

    }

    /**

     * 归并排序<br>

     * 所谓归并，就是合并两个有序数组；归并排序也用了分而治之的思想，把一个数组分为若干个子数组；<br>

     * 当子数组的长度为1的时候，则子数组是有序的，于是就可以两两归并了；<br>

     * <br>

     * 由于归并排序需要分配空间来转储归并的结果，为了算法上的方便，归并算法的结果以返回值的形式出现；<br>

     */

    /**

     * 合并两个有序数组

     * @param a 有序数组1

     * @param b 有序数组2

     * @return 合并之后的有序数组；

     */

    public static int[] merge(int[] a, int[] b) {

        int result[] = new int[a.length + b.length];

        int i = 0, j = 0, k = 0;

        while (i < a.length && j < b.length) {

            if (a[i] < b[j]) {

                result[k++] = a[i];

                i++;

            } else {

                result[k++] = b[j];

                j++;

            }

        }

        while (i < a.length) {

            result[k++] = a[i++];

        }

        while (j < b.length) {

            result[k++] = b[j++];

        }

        return result;

    }

    /**

     * 归并排序<br>

     * 把数组从中间一分为二，并对左右两部分递归调用，直到数组长度为1的时候，开始两两归并；<br>

     * 时间复杂度: 平均:O(nlogn)，最好:O(nlogn);最坏:O(nlogn);

     * 空间复杂度: O(n);要为归并的结果分配空间

     * @param 待排序数组；

     * @return 有序数组；

     */

    public static int[] mergeSort(int[] a) {

        if (a.length == 1) {

            return a;

        }

        int mid = a.length / 2;

        int[] leftPart = new int[mid];

        int[] rightPart = new int[a.length - mid];

        System.arraycopy(a, 0, leftPart, 0, leftPart.length);

        System.arraycopy(a, mid, rightPart, 0, rightPart.length);

        leftPart = mergeSort(leftPart);

        rightPart = mergeSort(rightPart);

        return merge(leftPart, rightPart);

    }

    /**

     * 选择排序<br>

     * 和插入排序类似，它也把数组分割为有序区和无序区，所不同的是：<br>

     * 插入排序是拿无序区的首元素插入到有序区适当的位置，而<br>

     * 选择排序是从无序区中挑选最小的放到有序区最后；<br>

     * <br>

     * 两层循环，外层控制有序区的队尾，内层用来查找无序区最小元素；<br>

     *

     * 时间复杂度: 平均:O(n^2)，最好:O(n);最坏:O(n^2);

     * 空间复杂度: O(1);

     * @param a

     */

    public static void selectSort(int[] a) {

        for (int i = 0; i < a.length; i++) {

            int minIndex = i;

            for (int j = i + 1; j < a.length; j++) {

                if (a[j] < a[minIndex]) {

                    minIndex = j;

                }

            }

            int tmp = a[i];

            a[i] = a[minIndex];

            a[minIndex] = tmp;

        }

    }

    /**

     * 希尔排序<br>

     * 其思想是把数组按等步长(/间距)划分为多个子序列，对各个子序列做普通的插入排序，<br>逐次降低步长，直到为1的时候最后再做一次普通的插入排序；

     * 用一个极端的例子作比方，我有数列如下：<br>

     * [1,2,3,4,5,6,7,8,9,10];<br>

     * 初始的时候，步长gap=5；则划分的子数组为[1,6], [2,7], [3,8], [4,9], [5,10];<br>对他们分别排序(当然由于本数组特殊，所以结果是不变的)；<br>

     * 然后gap=2=5/2; 子数组为[1,3,5,7,9], [2,4,6,8,10]; <br>

     * 最后gap=1=2/2; 做一次全局排序；<br>

     * <br>

     * 希尔排序克服了插入/冒泡排序的弱点(一次只能把元素移动一个相邻的位置), <br>依靠大步长，可以把元素尽快移动到目标位置(或附近);<br>

     * 希尔排序实际上是插入排序的变种。它适用于：当数组总体有序，个别需要调整的情况；这时候利用插入排序的优势，可以达到O(n)的效率；<br>

     * 影响希尔算法的一个重要的因素是步长选择，一个好步长的优点是：后面的短步长排序不会破坏前面的长步长排序；<br>

     * 怎么理解这种破坏呢？前面的长步长把一个较小的数移到了左面，但是在缩小步长之后有可能又被交换到了右面 (因为它被分到了一个有很多比它更小的组)；<br>

     * 关于步长，可以查看http://zh.wikipedia.org上面关于希尔排序的页面；<br>

     * 下面的程序是希尔排序最基础的写法，适合用来理解希尔排序思想；<br>

     *

     * 时间复杂度： 受步长影响较大，n/2步长的平均复杂度为n(logn)^2;

     */

    public static void shellSort(int[] a) {

        // 控制间距；间距逐渐减小，直到为1；

        for (int gap = a.length / 2; gap > 0; gap /= 2) {

            // 扫描每个子数组

            for (int i = 0; i < gap; i++) {

                // 对每个字数组，扫描无序区；注意增量；

                // a[i]是初始有序区；

                for (int j = i + gap; j < a.length; j += gap) {

                    // 无序区首元素小于有序区尾元素，说明需要调整

                    if (a[j] < a[j - gap]) {

                        int tmp = a[j];

                        int k = j - gap;

                        //从有序区尾向前搜索查找适当的位置；

                        while (k >= 0 && a[k] > tmp) {

                            a[k + gap] = a[k];

                            k -= gap;

                        }

                        a[k + gap] = tmp;

                    }

                }

            }

        }

    }

    /**

     * 改进的希尔排序<br>

     * 改进之处在于：上面的写法用一个for循环来区别对待每个字数组；而实际上是不必要的；<br>

     * a[0,1,...gap-1]作为所有子数组的有序区，a[gap,...n-1]作为所有字数组的无序区；<br>

     * <br>

     * 该改进在时间效率上没有改进；只是让程序看起来更简洁；<br>

     * @param a

     */

    public static void shellSortAdvanced(int[] a) {

        // 控制步长

        for (int gap = a.length / 2; gap > 0; gap /= 2) {

            // 从无序区开始处理，把多个子数组放在一起处理；

            for (int j = gap; j < a.length; j++) {

                // 下面的逻辑和上面是一样的；

                if (a[j] < a[j - gap]) {

                    int tmp = a[j];

                    int k = j - gap;

                    while (k >= 0 && a[k] > tmp) {

                        a[k + gap] = a[k];

                        k -= gap;

                    }

                    a[k + gap] = tmp;

                }

            }

        }

    }

    /**

     * 改进的希尔排序2<br>

     * 在吸收shellSortAdvanced思想的基础上，采用insertAdvanced2的做法；<br>即无序区首元素通过朝前冒泡的形式移动的适当的位置；<br>

     * @param a

     */

    public static void shellSortAdvanced2(int[] a) {

        for (int gap = a.length / 2; gap > 0; gap /= 2) {

            for (int i = gap; i < a.length; i++) {

                if (a[i] < a[i - gap]) {

                    for (int j = i - gap; j >= 0 && a[j + gap] > a[j]; j -= gap) {

                        int tmp = a[j];

                        a[j] = a[j + gap];

                        a[j + gap] = tmp;

                    }

                }

            }

        }

    }

    /**

     * 堆排序<br>

     * 堆的定义：堆是一个完全，或近似完全的二叉树，堆顶元素的值大于左右孩子的值，左右孩子也需要满足这个条件；<br>

     * 按照堆的定义，堆可以是大顶堆(maxHeap)，或小顶堆(minHeap)；<br>

     * 一般用数组即可模拟二叉树，对于任意元素i，左孩子为2*i+1,右孩子为2*i+2;父节点为(i-1)/2;

     *

     * 时间复杂度: 平均:O(nlogn);

     * 空间复杂度: O(1);

     * @param a

     */

    public static void heapSort(int[] a) {

        // 先从最后一个非叶子节点往上调整，使满足堆结构；

        for (int i = (a.length - 2) / 2; i >= 0; i--) {

            maxHeapAdjust(a, i, a.length);

        }

        // 每次拿最后一个节点和第一个交换，然后调整堆；直到堆顶；

        for (int i = a.length - 1; i > 0; i--) {

            int tmp = a[i];

            a[i] = a[0];

            a[0] = tmp;

            maxHeapAdjust(a, 0, i);

        }

    }

    /**

     * 调整堆<br>

     * 把以i为跟节点的二叉树调整为堆；<br>

     * 可以这么来思考这个过程：这个完全二叉树就像一个金字塔，塔顶的小元素沿着树结构，往下沉降；<br>

     * 调整的结果是最大的元素在金字塔顶，然后把它从堆中删除(把它交换到堆尾，然后堆收缩一格)；<br>

     * 堆排序快的原因就是根据二叉树的特点，一个节点要沉降到合适的位置，只需要logn步；同时前期调整的结果(大小顺序)会被记录下来，从而加快后续的调整；<br>

     * @param a 待排数组

     * @param i 堆顶

     * @param len 堆长度

     */

    public static void maxHeapAdjust(int[] a, int i, int len) {

        int tmp = a[i];

        // j是左孩子节点

        int j = i * 2 + 1;

        //

        while (j < len) {

            // 从左右孩子中挑选大的

            // j+1是右孩子节点

            if ((j + 1) < len && a[j + 1] > a[j]) {

                j++;

            }

            // 找到恰当的位置就不再找

            if (a[j] < tmp) {

                break;

            }

            // 否则把较大者沿着树往上移动；

            a[i] = a[j];

            // i指向刚才的较大的孩子；

            i = j;

            // j指向新的左孩子节点；

            j = 2 * i + 1;

        }

        // 把要调整的节点值下沉到适当的位置；

        a[i] = tmp;

    }

    /**

     * 二叉树排序<br>

     * 二叉树的定义是嵌套的：<br>节点的值大于左叶子节点的值，小于右叶子节点的值；叶子节点同样满足这个要求；<br>

     * 二叉树的构造过程就是排序的过程：<br>

     * 先构造跟节点，然后调用add方法添加后续节点为跟节点的子孙节点；这个过程也是嵌套的;<br>

     * <br>

     * 中序遍历二叉树即得到有序结果；<br>

     * 二叉树排序用法特殊，使用情形要视情况而定；<br>

     *

     * 时间复杂度: 平均:O(nlogn);

     * 空间复杂度: O(n);

     *

     * @param a

     */

    public static void binaryTreeSort(int[] a) {

        // 构造一个二叉树节点内部类来实现二叉树排序算法；

        class BinaryNode {

            int value;

            BinaryNode left;

            BinaryNode right;

            public BinaryNode(int value) {

                this.value = value;

                this.left = null;

                this.right = null;

            }

            public void add(int value) {

                if (value > this.value) {

                    if (this.right != null) {

                        this.right.add(value);

                    } else {

                        this.right = new BinaryNode(value);

                    }

                } else {

                    if (this.left != null) {

                        this.left.add(value);

                    } else {

                        this.left = new BinaryNode(value);

                    }

                }

            }

            /**

             * 按中序遍历二叉树，就是有序的。

             */

            public void iterate() {

                if (this.left != null) {

                    this.left.iterate();

                }

                // 在测试的时候要把输出关掉，以免影响性能；

                // System.out.print(value + ", ");

                if (this.right != null) {

                    this.right.iterate();

                }

            }

        }

        BinaryNode root = new BinaryNode(a[0]);

        for (int i = 1; i < a.length; i++) {

            root.add(a[i]);

        }

        root.iterate();

    }

}

各排序算法的性能比较

排序方法	最好时间复杂度	平均时间复杂度	最坏时间复杂度	空间复杂度	稳定性
插入排序	O(n)	O(n^2)	O(n^2)	O(1)	稳定
希尔排序		O(n^1.3)		O(1)	不稳定
选择排序	O(n^2)	O(n^2)	O(n^2)	O(1)	稳定
堆排序	O(nlbn)	O(nlbn)	O(nlbn)	O(1)	不稳定
冒泡排序	O(n)	O(n^2)	O(n^2)	O(1)	稳定
快速排序	O(nlbn)	O(nlbn)	O(n^2)	O(lbn)	不稳定
归并排序	O(nlbn)	O(nlbn)	O(nlbn)	O(n)	稳定
基数排序	O(m*n)	O(m*n)	O(m*n)	O(n)	稳定

秒客网

Java常用排序算法及性能测试集合

相关文章