冒泡排序的进化过程

10/14/2021 算法排序

# 0 基础版本

所有情况下时间复杂度都为O($n^2$)

public static void bob(int[] array) {
    // 总共比较n-1轮
    for (int i = 0; i < array.length - 1; i++) {
        // 因为每次都能确定一个最大元素,所以每次都能少比较一次
        for (int j = 0; j < array.length - i - 1; j++) {
            if (array[j] > array[j + 1]) {
                int temp = array[j];
                array[j] = array[j + 1];
                array[j + 1] = temp;
            }
        }
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
13

上述算法简单粗暴,对任意数组上来就是两层for套着猛干。

如果现在有个有序数组,比如{1,2,3,4,5,6,7,8},也会白费力气去浪费cpu,这是不必要的。怎么避免呢?

我们看到,如果元素整体有序,那么上述代码中的

if (arr[j] > arr[j + 1])
1

就永远不会满足,那么就不会发生元素的交换,所以我们可以添加个布尔值,来判断是否发生了元素交换,如果没发生,则认为已经整体有序了,直接跳出即可。如下:

# 1 进阶版本

这里添加了一个boolean来判断本次是否有元素交换,没有则提前结束。

private static void bob2(int[] arr) {
    int length = arr.length;
    for (int i = 0; i < length; i++) {
        boolean swap = false;
        for (int j = 0; j < length - 1; j++) {
            if (arr[j] > arr[j + 1]) {
                int temp = arr[j];
                arr[j] = arr[j + 1];
                arr[j + 1] = temp;

                swap = true;
            }
        }
        if (!swap) break;
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

上述代码可以避免对整体有序的数组瞎排序。但是,如果一个数组不是整体有序,而是局部有序呢,比如{4,3,2,1,5,6,7,8},我们观察到后半部分是不需要参加排序的,也就是说,只需要将前半部分排序即可。

所以,我们就要确定从哪开始的元素是有序的,也就是确定有序区开始的下标

那么,怎么确定这个下标呢?

我们可以想一下,对于冒泡排序,如果后面的元素比前面的大,才交换,否则就不交换,也就是说,最后一次发生交换的位置,其后面一定是有序的。比如在位置i发生了交换,i后面没有发生过交换,那么i后面一定是有序的,否则i后面就还会发生交换。

所以,每次元素最后一次交换的位置,就是有序区下标的起点,也是无序区下标的终点。

定义一个下标,每次有元素交换就更新下标,下标后面的元素就是有序的,每次比较只比较下标前面的元素即可

代码如下:

# 2 高阶版本

private static void bob3(int[] arr) {
    int length = arr.length;
    int lastSwapIndex = 0;
    // 定义有序区起始点,也就是无序区终点
    int sortedBorder = length - 1;
    for (int i = 0; i < length; i++) {
        boolean swap = false;
        // 只比较无序区
        for (int j = 0; j < sortedBorder; j++) {
            if (arr[j] > arr[j + 1]) {
                int temp = arr[j];
                arr[j] = arr[j + 1];
                arr[j + 1] = temp;
                swap = true;
                // 发生了交换,就更新下标
                lastSwapIndex = j;
            }
        }
        // 更新下标
        sortedBorder = lastSwapIndex;
        if (!swap) break;
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

上述代码就可以解决局部有序但整体无序的情况。

但是我们发现,上面的代码,都是从左向右比较的,如果数组是{2,3,4,5,6,7,8,1}这样呢,也是局部有序,但是,如果从左往右比,则很费时间,而从右往左比,则一轮就能结束。

但是!如果从右往左比的话,遇见{8,1,2,3,4,5,6,7}这样的又跪了,怎么办呢?我们可以采用双向比较法,也就是一次从左向右比,一次从右向左比,这就叫鸡尾酒排序

现在我们使用鸡尾酒排序(双向排序),每次排序后交换方向,代码如下:

# 3 最终版本(鸡尾酒排序)

private static void bob4(int[] arr) {
    int length = arr.length;
    for (int i = 0; i < (length >>> 1); i++) {
        boolean swap = false;
        // 从左到右
        for (int j = 0; j < length - 1; j++) {
            if (arr[j] > arr[j + 1]) {
                swap(arr, j, j + 1);
                swap = true;
            }
        }

        if (!swap) break;

        // 从右到左
        swap = false;
        for (int j = length - 1; j > 0; j--) {
            if (arr[j] < arr[j - 1]) {
                swap(arr, j, j - 1);
                swap = true;
            }
        }

        if (!swap) break;
    }
}

// 交换元素
private static void swap(int[] arr, int i, int j) {
    arr[i] ^= arr[j];
    arr[j] ^= arr[i];
    arr[i] ^= arr[j];
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33

# 总结

我们虽然针对冒泡排序进行了多次优化,但是它的时间复杂度还是O(n2),这是无法避免的,因为冒泡排序每次只是交换相邻元素,也就是只消除了一个逆序对,凡是通过交换相邻元素进行的排序,其时间复杂度都是O(n2)

为什么呢?因为交换相邻元素每次只消除了一个逆序对。我们来证明下。

学过<线性代数>的应该知道逆序这个定义。

在一个排列中,如果一对数的前后位置与大小顺序相反,即前面的数大于后面的数,那么它们就称为一个逆序。一个排列中逆序的总数就称为这个排列的逆序数。

证明: 凡是通过交换相邻元素进行的排序,其时间复杂度都是O($n^2$)

假设现有任意序列L,其共有n个元素,则其共能组成$C_n^2$个数对(从n个元素中,挑出2个元素组成的数对),也就是$(\frac{n(n-1)}{2})$个, 其中逆序数为a;然后取其反序列Lr,其逆序数为b,而且b=$(\frac{n(n-1)}{2})$-a,因为原来L中的顺序对,在Lr中全变成了逆序对,而且对于任意的数对,要么是顺序,要么是逆序(相同的可以认为是顺序),所以a+b=$(\frac{n(n-1)}{2})$。

所以,L和Lr的总逆序对就是$(\frac{n(n-1)}{2})$,那么单个L的逆序对就是$(\frac{n(n-1)}{4})$,当n趋近于+∞时,就是$n^2$,而通过交换相邻元素每次只能消除一个逆序对,所以总共需要交换$n^2$次,所以相应算法的时间复杂度就是O($n^2$)。

为什么交换相邻元素只能消除一个逆序对呢,因为只改变了相邻俩元素的位置,它俩前后的该比它大还是比它大,该比它小还是比它小。比如{5,4,3,2,1},我们交换了3和2,变为{5,4,2,3,1},我们发现,只是消除了{1,2}这个逆序对,前面的5和4,还是比它俩大,后面的1,还是比它俩小,所以只消除了一个逆序对,这里不再废话。

证明完毕。

其实,我们可以扩展一下,凡是每次只能消除一个逆序对的算法,其时间复杂度都是O($n^2$)。也不再废话。

Last Updated: 1/27/2022, 10:48:51 AM