当前位置：

首页
/
IT
/
程序
/
排序算法 Java 实现

排序算法 Java 实现

选择排序

核心思想

选择最小元素, 与第一个元素交换位置; 剩下的元素中选择最小元素, 与当前剩余元素的最前边的元素交换位置.

分析

选择排序的比较次数与序列的初始排序无关, 比较次数都是 N(N-1)/2.

移动次数最多只有 n-1 次.

因此, 时间复杂度为 O(N^2), 无论输入是否有序都是如此, 输入的顺序只决定了交换的次数, 但是比较的次数不变.

选择排序是不稳定的, 比如 5 6 5 3 的情况.

代码

public class SelectionSort {
    public void selectionSort(int[] nums){
        if(nums==null)
            return;
        for(int i=0;i<nums.length;i++) {
            int index = i;
            for (int j = i; j <nums.length; j++) {
                if (nums[j] < nums[index]) {
                    index = j;
                }
            }
            swap(nums, i, index);
        }
    }
}

冒泡排序:

核心思想

从左到右不断交换相邻逆序的元素, 这样一趟下来把最大的元素放到了最右侧. 不断重复这个过程, 知道一次循环中没有发生交换, 说明已经有序, 退出.

分析

当原始序列有序, 比较次数为 n-1 , 移动次数为 0, 因此最好情况下时间复杂度为 O(N).

当逆序排序时, 比较次数为 N(N-1)/2, 移动次数为 3N(N-1)/2, 因此最坏情况下时间复杂度为 O(N^2).

平均时间复杂度为 O(N^2).

元素两两交换时, 相同元素前后顺序没有改变, 因此具有稳定性.

代码

public class BubbleSort {
    public void bubbleSort(int[] nums){
        for(int i=nums.length-1;i>0;i--){
            boolean sorted=false;
            for(int j=0;j<i;j++){
                if(nums[j]>nums[j+1]){
                    Sort.swap(nums,j,j+1);
                    sorted=true;
                }
            }
            if(!sorted)
                break;
        }
    }

插入排序

核心思想

每次将当前元素插入到左侧已经排好序的数组中, 使得插入之后左侧数组依然有序.

分析

因为插入排序每次只能交换相邻元素, 令逆序数量减少 1, 因此交换次数等于逆序数量.

因此, 插入排序的复杂度取决于数组的初始顺序.

数组已经有序, 需要 N-1 次比较和 0 次交换, 时间复杂度为 O(N).

数组完全逆序, 需要 N(N-1)/2 次比较和交换 N(N-1)/2 次, 时间复杂度为 O(N^2)

平均情况下, 时间复杂度为 O(N^2)

插入排序具有稳定性

代码

public class InsertionSort {
    public void insertionSort(int[] nums){
        for(int i=1;i<nums.length;i++){
            for(int j=i;j>0;j--){
                if(nums[j]<nums[j-1])
                    swap(nums,j,j-1);
                else
                    break;// 已经放到正确位置上了
            }
        }
    }
}

希尔排序

对于大规模的数组, 插入排序很慢, 因为它只能交换相邻的元素, 每次只能将逆序数量减少 1.

核心思想

希尔排序为了解决插入排序的局限性, 通过交换不相邻的元素, 每次将逆序数量减少大于 1. 希尔排序使用插入排序对间隔为 H 的序列进行排序, 不断减少 H 直到 H=1 , 最终使得整个数组是有序的.

时间复杂度

希尔排序的时间复杂度难以确定, 并且 H 的选择也会改变其时间复杂度.

希尔排序的时间复杂度是低于 O(N^2) 的, 高级排序算法只比希尔排序快两倍左右.

稳定性

希尔排序不具备稳定性.

代码

public class ShellSort {
    public void shellSort(int[] nums){
        int N=nums.length;
        int h=1;
        while(h<N/3){
            h=3*h+1;
        }
        while(h>=1){
            for(int i=h;i<N;i++){
                for(int j=i;j>0;j--){
                    if(nums[j]<nums[j-1]){
                        swap(nums,j,j-1);
                    }else{
                        break;// 已经放到正确位置上了
                    }
                }
            }
        }
    }
}

归并排序

核心思想

将数组分为两部分, 分别进行排序, 然后进行归并.

归并方法

public void merge(int[] nums, int left, int mid, int right) {
        int p1 = left, p2 = mid + 1;
        int[] tmp = new int[right-left+1];
        int cur=0;
        // 两个指针分别指向左右两个子数组, 选择更小者放入辅助数组
        while(p1<=mid&&p2<=right){
            if(nums[p1]<nums[p2]){
                tmp[cur++]=nums[p1++];
            }else{
                tmp[cur++]=nums[p2++];
            }
        }
        // 将还有剩余的数组放入到辅助数组
        while(p1<=mid){
            tmp[cur++]=nums[p1++];
        }
        while(p2<=right){
            tmp[cur++]=nums[p2++];
        }
        // 拷贝
        for(int i=0;i<tmp.length;i++){
            nums[left+i]=tmp[i];
        }
    }

代码实现

递归方法: 自顶向下

通过递归调用, 自顶向下将一个大数组分成两个小数组进行求解.

public void up2DownMergeSort(int[] nums, int left, int right) {
        if(left==right)
            return;
        int mid=left+(right-left)/2;
        mergeSort(nums,left,mid);
        mergeSort(nums,mid+1,right);
        merge(nums,left,mid,right);
    }

非递归: 自底向上

public void down2UpMergeSort(int[] nums) {
        int N = nums.length;
        for (int sz = 1; sz <N; sz += sz) {
            for (int lo = 0; lo < N - sz; lo += sz + sz) {
                merge(nums, lo, lo + sz - 1, Math.min(lo + sz + sz - 1, N - 1));
            }
        }
    }

分析

把一个规模为 N 的问题分解成两个规模分别为 N/2 的子问题, 合并的时间复杂度为 O(N).T(N)=2T(N/2)+O(N).

得到其时间复杂度为 O(NlogN), 并且在最坏, 最好和平均情况下时间复杂度相同.

归并排序需要 O(N) 的空间复杂度.

归并排序具有稳定性.

快速排序

核心思想

快速排序通过一个切分元素 pivot 将数组分为两个子数组, 左子数组小于等于切分元素, 右子数组大于等于切分元素, 将子数组分别进行排序, 最终整个排序.

partition

取 a[l] 作为切分元素, 然后从数组的左端向右扫描直到找到第一个大于等于它的元素, 再从数组的右端向左扫描找到第一个小于它的元素, 交换这两个元素. 不断进行这个过程, 就可以保证左指针 i 的左侧元素都不大于切分元素, 右指针 j 的右侧元素都不小于切分元素. 当两个指针相遇时, 将切分元素 a[l] 和 a[j] 交换位置.

private int partition(int[] nums, int left, int right) {
        int p1=left,p2=right;
        int pivot=nums[left];
        while(p1<p2){
            while(nums[p1++]<pivot&&p1<=right);
            while(nums[p2--]>pivot&&p2>=left);
            swap(nums,p1,p2);
        }
        swap(nums,left,p2);
        return p2;
    }

代码实现

public void sort(T[] nums, int l, int h) {
        if (h <= l)
            return;
        int j = partition(nums, l, h);
        sort(nums, l, j - 1);
        sort(nums, j + 1, h);
    }

分析

最好的情况下, 每次都正好将数组对半分, 递归调用次数最少, 复杂度为 O(NlogN).

最坏情况下, 是有序数组, 每次只切分了一个元素, 时间复杂度为 O(N^2). 为了防止这种情况, 在进行快速排序时需要先随机打乱数组.

不具有稳定性.

改进

切换到插入排序: 递归的子数组规模小时, 用插入排序.

三数取中: 最好的情况下每次取中位数作为切分元素, 计算中位数代价比较高, 采用取三个元素, 将中位数作为切分元素.

三路快排

对于有大量重复元素的数组, 将数组分为小于, 等于, 大于三部分, 对于有大量重复元素的随机数组可以在线性时间内完成排序.

public void threeWayQuickSort(int[] nums,int left,int right){
        if(right<=left)
            return;
        int lt=left,cur=left+1,gt=right;
        int pivot=nums[left];
        while(cur<=gt){
            if(nums[cur]<pivot){
                swap(nums,lt++,cur++);
            }else if(nums[cur]>pivot){
                swap(nums,cur,gt--);
            }else{
                cur++;
            }
        }
        threeWayQuickSort(nums,left,lt-1);
        threeWayQuickSort(nums,gt+1,right);
    }

基于 partition 的快速查找

利用 partition() 可以在线性时间复杂度找到数组的第 K 个元素.

假设每次能将数组二分, 那么比较的总次数为 (N+N/2+N/4+..), 直到找到第 k 个元素, 这个和显然小于 2N.

public int select(int[] nums, int k) {
    int l = 0, h = nums.length - 1;
    while (h> l) {
        int j = partition(nums, l, h);
        if (j == k) {
            return nums[k];
        } else if (j> k) {
            h = j - 1;
        } else {
            l = j + 1;
        }
    }
    return nums[k];
}

堆排序

堆

堆可以用数组来表示, 这是因为堆是完全二叉树, 而完全二叉树很容易就存储在数组中. 位置 k 的节点的父节点位置为 k/2, 而它的两个子节点的位置分别为 2k 和 2k+1. 在这里, 从下标为 1 的索引开始的位置, 是为了更清晰地描述节点的位置关系.

上浮和下沉

当一个节点比父节点大, 不断交换这两个节点, 直到将节点放到位置上, 这种操作称为上浮.

private void shiftUp(int k) {
        while (k> 1 && heap[k / 2] <heap[k]) {
            swap(k / 2, k);
            k = k / 2;
        }
    }

当一个节点比子节点小, 不断向下进行比较和交换, 当一个基点有两个子节点, 与最大节点进行交换. 这种操作称为下沉.

private void shiftDown(int k){
        while(2*k<=size){
            int j=2*k;
            if(j<size&&heap[j]<heap[j+1])
                j++;
            if(heap[k]<heap[j])
                break;
            swap(k,j);
            k=j;
        }
    }

堆排序

把最大元素和当前堆中数组的最后一个元素交换位置, 并且不删除它, 那么就可以得到一个从尾到头的递减序列.

构建堆建立堆最直接的方法是从左到右遍历数组进行上浮操作. 一个更高效的方法是从右到左进行下沉操作. 叶子节点不需要进行下沉操作, 可以忽略, 因此只需要遍历一半的元素即可.

交换堆顶和最坏一个元素, 进行下沉操作, 维持堆的性质.

public class HeapSort {
    public void sort(int[] nums){
        int N=nums.length-1;
        for(int k=N/2;k>=1;k--){
            shiftDown(nums,k,N);
        }
        while(N>1){
            swap(nums,1,N--);
            shiftDown(nums,1,N);
        }
        System.out.println(Arrays.toString(nums));
    }
    private void shiftDown(int[] heap,int k,int N){
        while(2*k<=N){
            int j=2*k;
            if(j<N&&heap[j]<heap[j+1])
                j++;
            if(heap[k]>=heap[j])
                break;
            swap(heap,k,j);
            k=j;
        }
    }
    private void swap(int[] nums,int i,int j){
        int t=nums[i];
        nums[i]=nums[j];
        nums[j]=t;
    }
}

分析

建立堆的时间复杂度是 O(N).

一个堆的高度为 logN, 因此在堆中插入元素和删除最大元素的复杂度都是 logN.

在堆排序中, 对 N 个节点进行下沉操作, 复杂度为 O(NlogN).

现代操作系统很少使用堆排序, 因为它无法利用局部性原理进行缓存, 也就是数组元素很少和相邻的元素进行比较和交换.

比较

排序算法	最好时间复杂度	平均时间复杂度	最坏时间复杂度	空间复杂度	稳定性	适用场景
冒泡排序	O(N)	O(N^2)	O(N^2)	O(1)	稳定
选择排序	O(N)	O(N^2)	O(N^2)	O(1)	不稳定	运行时间和输入无关，数据移动次数最少，数据量较小的时候适用。
插入排序	O(N)	O(N^2)	O(N^2)	O(1)	稳定	数据量小、大部分已经被排序
希尔排序	O(N)	O(N^1.3)	O(N^2)	O(1)	不稳定
快速排序	O(NlogN)	O(NlogN)	O(N^2)	O(logN)-O(N)	不稳定	最快的通用排序算法，大多数情况下的最佳选择
归并排序	O(NlogN)	O(NlogN)	O(NlogN)	O(N)	稳定	需要稳定性，空间不是很重要
堆排序	O(NlogN)	O(NlogN)	O(NlogN)	O(1)	O(1)	不稳定

当规模较小, 如小于等于 50, 采用插入或选择排序.

当元素基本有序, 选择插入, 冒泡或随机的快速排序.

当规模较大, 采用 O(NlogN) 排序算法.

当待排序的关键字随机分布时, 快速排序的平均时间最短.

当需要保证稳定性的时候, 选用归并排序.

非比较排序

之前介绍的算法都是基于比较的排序算法, 下边介绍两种不是基于比较的算法.

计数排序

已知数据范围 x1 到 x2, 对范围中的元素进行排序. 可以使用一个长度为 x2-x1+1 的数组, 存储每个数字对应的出现的次数. 最终得到排序后的结果.

桶排序

桶排序假设待排序的一组数均匀独立的分布在一个范围中, 并将这一范围划分成几个桶. 然后基于某种映射函数, 将待排序的关键字 k 映射到第 i 个桶中. 接着将各个桶中的数据有序的合并起来, 对每个桶中的元素可以进行排序, 然后输出得到一个有序序列.

来源: https://juejin.im/post/5c9479a06fb9a0710f47e79c

与本文相关文章

暂无,快来抢沙发吧！