跳转到内容

归并排序

来自代码酷

归并排序[编辑 | 编辑源代码]

归并排序(Merge Sort)是一种基于分治法(Divide and Conquer)的高效排序算法,适用于各种数据类型和规模的数据集。其核心思想是将数组递归地分成两半,分别排序后再合并成一个有序数组。归并排序的时间复杂度为 O(nlogn),且是稳定排序(Stable Sort)。

算法原理[编辑 | 编辑源代码]

归并排序分为两个主要步骤: 1. 分割(Divide):将数组递归地分成两半,直到每个子数组只包含一个元素。 2. 合并(Merge):将两个已排序的子数组合并为一个有序数组。

分治法[编辑 | 编辑源代码]

归并排序遵循分治法:

  • 分解:将问题分解为更小的子问题。
  • 解决:递归地解决子问题。
  • 合并:将子问题的解合并为原问题的解。

算法步骤[编辑 | 编辑源代码]

1. 如果数组长度为 1,直接返回(已排序)。 2. 将数组分成左右两半。 3. 递归地对左半部分和右半部分进行归并排序。 4. 合并两个已排序的子数组。

代码示例[编辑 | 编辑源代码]

以下是 Python 实现的归并排序:

def merge_sort(arr):
    if len(arr) <= 1:
        return arr
    
    # 分割数组
    mid = len(arr) // 2
    left = arr[:mid]
    right = arr[mid:]
    
    # 递归排序
    left = merge_sort(left)
    right = merge_sort(right)
    
    # 合并
    return merge(left, right)

def merge(left, right):
    result = []
    i = j = 0
    
    # 比较并合并
    while i < len(left) and j < len(right):
        if left[i] <= right[j]:
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1
    
    # 处理剩余元素
    result.extend(left[i:])
    result.extend(right[j:])
    return result

# 示例输入
arr = [38, 27, 43, 3, 9, 82, 10]
sorted_arr = merge_sort(arr)
print("排序前:", arr)
print("排序后:", sorted_arr)

输入与输出[编辑 | 编辑源代码]

输入:[38, 27, 43, 3, 9, 82, 10]
输出:[3, 9, 10, 27, 38, 43, 82]

时间复杂度分析[编辑 | 编辑源代码]

归并排序的时间复杂度为 O(nlogn),因为:

  • 每次分割需要 O(logn) 层递归。
  • 每层合并需要 O(n) 时间。

空间复杂度为 O(n),因为需要额外的数组存储合并结果。

稳定性[编辑 | 编辑源代码]

归并排序是稳定排序,因为在合并时,当两个元素相等时,优先选择左子数组的元素,保持原始顺序。

实际应用[编辑 | 编辑源代码]

归并排序常用于以下场景: 1. 大数据排序:如外部排序(External Sorting),处理无法全部加载到内存的数据。 2. 链表排序:归并排序是链表排序的高效选择,因为链表合并不需要额外空间。 3. 并行计算:分治法天然适合并行化处理。

可视化示例[编辑 | 编辑源代码]

以下是归并排序的分割与合并过程:

graph TD A[38, 27, 43, 3, 9, 82, 10] --> B[38, 27, 43] A --> C[3, 9, 82, 10] B --> D[38] B --> E[27, 43] E --> F[27] E --> G[43] C --> H[3, 9] C --> I[82, 10] H --> J[3] H --> K[9] I --> L[82] I --> M[10] D & F & G --> N[27, 38, 43] J & K --> O[3, 9] L & M --> P[10, 82] N & O & P --> Q[3, 9, 10, 27, 38, 43, 82]

优化技巧[编辑 | 编辑源代码]

1. 小数组优化:当子数组较小时(如长度 ≤ 7),改用插入排序减少递归开销。 2. 原地合并:通过复杂实现减少空间占用(如块排序)。 3. 并行化:利用多线程加速分割与合并。

总结[编辑 | 编辑源代码]

归并排序是一种高效、稳定的排序算法,适合处理大规模数据。虽然需要额外空间,但其 O(nlogn) 的时间复杂度使其成为通用排序的重要选择。初学者可通过实现归并排序深入理解分治法的思想。