深入解析：如何优雅地合并两个已排序数组而不使用额外空间

2026-02-13 15:21:16 0条评论 2次阅读 0人点赞

你好！作为开发者，我们经常需要处理数据的排序与合并问题。今天，我想和你深入探讨一个经典且极具挑战性的面试题：合并两个已排序数组。这不仅仅是一道算法题，更是理解数组操作、双指针技巧以及空间复杂度优化的绝佳实战案例。

在文章的开始，让我们明确一下问题的具体要求。给定两个长度分别为 INLINECODE7127a988 和 INLINECODEb1766829 的已排序数组 INLINECODE65013646 和 INLINECODE7394796a。我们的任务是将它们合并，使得合并后的结果中，最小的 INLINECODE56890d89 个元素存入 INLINECODE0fc91718，剩余的 INLINECODEb200f25c 个元素存入 INLINECODE3dfc4cae。

问题的核心约束

这里有一个非常重要的细节：合并后，INLINECODE65caa4b5 和 INLINECODE77c313e5 仍需保持非递减顺序（即升序）。这意味着我们不能简单地把所有元素倒进一个大桶里乱序存放，而是要保证数组内部的有序性。在理想情况下，如果我们不限制空间复杂度，这很容易实现；但在实际工程和高性能要求的场景下，如何原地完成这一操作，才是真正考验功力的地方。

让我们先通过一个简单的例子来直观地理解一下。

#### 示例场景

假设我们有两个数组：

> 输入: arr1[] = [1, 3, 4, 5], arr2[] = [2, 4, 6, 8]

这里 INLINECODE42231a0c，INLINECODEf7f0891f。如果我们将它们完全合并并排序，我们会得到：

> 全排序: [1, 2, 3, 4, 4, 5, 6, 8]

根据规则，前 4 个最小的元素归位到 INLINECODEc8f3d4aa，剩下的归位到 INLINECODEd52663d3：

> 输出: arr1[] = [1, 2, 3, 4], arr2[] = [4, 5, 6, 8]

探索解决方案：从朴素到优雅

为了彻底掌握这个问题，我们将分步骤讨论。首先，我们会看最容易理解的朴素方法（使用额外空间），打好基础；随后，我们将深入探讨更高级的双指针与原地交换算法，这才是提升性能的关键。

—

方法一：合并并排序（朴素方法）

这个思路的核心非常直接。如果我们想象一下，把两个数组里的所有数字都倒进一个临时的“容器”里，然后利用现成的排序工具把它们排好序，最后再把前 INLINECODE2329d781 个切分给 INLINECODE86c6edc0，剩下的切分给 arr2。这种方法虽然不是最优的（因为它消耗了额外的 O(n+m) 空间），但逻辑清晰，是实现快速原型或者处理一次性任务的好方法。

#### 算法思路

创建一个大小为 INLINECODE8100e559 的临时数组 INLINECODE8a5709fc。
将 INLINECODEd27e9c18 的所有元素复制到 INLINECODE0c775db2 的前半部分。
将 INLINECODE7c6fe1ea 的所有元素复制到 INLINECODE0248bccb 的后半部分。
调用标准库的排序函数（如 C++ 的 INLINECODE10f28f8e 或 Java 的 INLINECODE1044f38b）。
将排序后 INLINECODEa8b4a11d 的前 INLINECODE529164ad 个元素复制回 arr1。
将剩余的 INLINECODE1dbd58e0 个元素复制回 INLINECODE3b120c4a。

#### 复杂度分析

时间复杂度: O((n + m) log(n + m))。主要是耗在排序步骤上，因为标准的排序算法通常基于比较。

空间复杂度: O(n + m)。我们需要额外的数组来存储所有元素。

#### 代码实现

让我们来看看具体的代码实现。注意这里的注释，它们能帮助你更好地理解每一步的操作。

C++ 实现

在 C++ 中，我们可以利用 INLINECODEbd345fc0 和 INLINECODEd4e01edf 非常简洁地完成这一任务。

#include 
#include 
#include  // 包含 sort 函数
using namespace std;

// 两个数组的合并函数
void mergeArrays(vector& arr1, vector& arr2) {
    int n = arr1.size();
    int m = arr2.size();
    
    // 步骤 1: 创建一个临时数组，大小为两者之和
    // 这里的 merged 数组就是我们用来暂存所有元素的“容器”
    vector merged(n + m);
    
    // 步骤 2: 将 arr1 的元素放入 merged
    for (int i = 0; i < n; ++i) {
        merged[i] = arr1[i];
    }
    
    // 步骤 3: 将 arr2 的元素接在 merged 后面
    for (int j = 0; j < m; ++j) {
        merged[n + j] = arr2[j];
    }

    // 步骤 4: 对合并后的数组进行排序
    sort(merged.begin(), merged.end());

    // 步骤 5: 将排序后的前 n 个元素放回 arr1
    for (int i = 0; i < n; ++i) {
        arr1[i] = merged[i];
    }

    // 步骤 6: 将剩余的 m 个元素放回 arr2
    for (int j = 0; j < m; ++j) {
        arr2[j] = merged[n + j];
    }
}

int main() {
    vector arr1 = {1, 3, 5, 7};
    vector arr2 = {2, 4, 6, 8};

    cout << "合并前:" << endl;
    cout << "arr1: ";
    for (int num : arr1) cout << num << " ";
    cout << "
arr2: ";
    for (int num : arr2) cout << num << " ";
    cout << endl;

    mergeArrays(arr1, arr2);

    cout << "合并后:" << endl;
    for (int num : arr1) {
        cout << num << ' ';
    }
    cout << endl;

    for (int num : arr2) {
        cout << num << ' ';
    }
    cout << endl;

    return 0;
}

Java 实现

Java 的处理方式与之类似，利用 Arrays.sort() 可以极大简化代码。

import java.util.Arrays;

class MergeArrayDemo {
    // 静态方法，方便直接调用
    static void mergeArrays(int[] arr1, int[] arr2) {
        int n = arr1.length;
        int m = arr2.length;

        // 创建临时数组存储所有元素
        int[] merged = new int[n + m];

        // 复制 arr1
        for (int i = 0; i < n; i++) {
            merged[i] = arr1[i];
        }
        // 复制 arr2
        for (int j = 0; j < m; j++) {
            merged[n + j] = arr2[j];
        }

        // Java 内置的高效排序
        Arrays.sort(merged);

        // 结果分配回原数组
        // 复制前 n 个到 arr1
        for (int i = 0; i < n; i++) {
            arr1[i] = merged[i];
        }
        // 复制剩余部分到 arr2
        for (int j = 0; j < m; j++) {
            arr2[j] = merged[n + j];
        }
    }
    
    public static void main(String[] args) {
        int[] arr1 = {1, 3, 4, 5};
        int[] arr2 = {2, 4, 6, 8};
        
        mergeArrays(arr1, arr2);
        
        System.out.println("arr1: " + Arrays.toString(arr1));
        System.out.println("arr2: " + Arrays.toString(arr2));
    }
}

进阶优化：无额外空间的双指针交换

在资源受限的嵌入式系统或高性能计算场景中，O(n+m) 的额外空间开销是难以接受的。作为 2026 年的开发者，我们不仅要解决问题，更要追求极致的资源利用率。这里我们要介绍一种基于“插入排序”思想但经过优化的双指针交换法。

#### 算法核心思想

我们可以将这个过程看作是 INLINECODEed6f76ee 和 INLINECODE4f133bfb 两个有序流的动态整合。我们遍历 INLINECODE9b836657，对于每一个元素 INLINECODE01d3671e，我们都检查它是否大于 INLINECODE98dd904c 的第一个元素（因为 INLINECODEc423e18c 是升序的，第一个元素就是它当前的最小值）。

比较：如果 INLINECODEa2b56991，说明为了保证全局有序，INLINECODE1dc6fddb 应该放到 arr1[i] 的位置。
交换：我们将 INLINECODEeb2e1b4d 和 INLINECODE6b4743b3 交换。
修正 INLINECODE018c57b4：交换后，INLINECODE72086dc7 的头元素变了，可能不再有序。我们需要将新的 INLINECODEc16e9be2 放回到 INLINECODE5729cee1 中正确的位置，以维持 INLINECODE231d60a5 的升序性质。这可以通过对 INLINECODEaede7210 进行一次类似插入排序的操作来完成。

#### 复杂度分析

时间复杂度：最坏情况下为 O(n m)。当 INLINECODEe46d6dce 的所有元素都大于 INLINECODE4ed05ea3 的所有元素时，每次交换都需要对 INLINECODE27c25e46 进行重排。虽然理论上比 Gap 算法慢，但在 INLINECODE2f29cc37 和 m 较为接近且数据部分有序的情况下，性能依然可观。

空间复杂度：O(1)。这是这种方法最大的优势，原地操作，无需任何辅助数组。

#### 现代 C++ 实现 (C++20 标准)

让我们使用更现代的语法来实现这一逻辑，注重代码的可读性和标准库的运用。

#include 
#include 
#include  // std::sort, std::is_sorted_until

using namespace std;

// 辅助函数：在已排序的数组中插入元素并保持有序
// 相当于手动实现 std::push_back + std::push_heap (但这里我们要插入头部并移动)
void insertAndSort(vector& arr, int val) {
    // 找到第一个大于 val 的位置
    auto it = upper_bound(arr.begin(), arr.end(), val);
    // 插入并保持有序 (vector 的 insert 会移动元素，这里我们手动模拟以展示逻辑)
    // 注意：实际上为了性能，我们通常直接交换并重排 arr2
    // 这里为了演示，我们直接模拟 arr2 的重排过程
    int i = 0;
    int n = arr.size();
    // 先把 val 放在数组末尾（临时扩容逻辑，这里假设 arr2 有足够空间或者我们只处理前m个）
    // 在本题场景下，arr2 大小不变，我们只是交换了 arr1[i] 和 arr2[0]
    // 现在的任务是修正 arr2
    
    // 实际上，我们交换后，arr2[0] 是新来的大数，我们需要把它往后移
    // 寻找 arr2[0] 在 arr2 中的正确位置
    int key = arr[0];
    int j = 1;
    while (j < arr.size() && arr[j] < key) {
        arr[j-1] = arr[j]; // 元素前移
        j++;
    }
    arr[j-1] = key; // 插入到正确位置
}

void mergeArraysInPlace(vector& arr1, vector& arr2) {
    int n = arr1.size();
    int m = arr2.size();
    
    for (int i = 0; i  arr2[0]) {
            swap(arr1[i], arr2[0]);
            
            // 现在 arr2[0] 变成了从 arr1 换过来的较大的数
            // 我们需要重新调整 arr2 以保持其升序性质
            // 将新的 arr2[0] 插入到 arr2 的正确位置
            int first_ele = arr2[0];
            int k = 1;
            while (k < m && arr2[k] < first_ele) {
                arr2[k-1] = arr2[k];
                k++;
            }
            arr2[k-1] = first_ele;
        }
    }
}

int main() {
    vector arr1 = {1, 3, 5, 7};
    vector arr2 = {0, 2, 6, 8}; // 注意：arr2 有个 0，会触发多次交换

    mergeArraysInPlace(arr1, arr2);

    cout << "Optimized Merge (In-Place):" << endl;
    cout << "arr1: ";
    for (int x : arr1) cout << x << " ";
    cout << endl;
    cout << "arr2: ";
    for (int x : arr2) cout << x << " ";
    cout << endl;

    return 0;
}

2026 工程视点：AI 时代如何编写与优化算法

作为站在 2026 年的技术前沿，我们编写代码的方式已经发生了深刻的变化。合并两个数组虽然是一个基础问题，但在现代软件工程生命周期中，它承载了更多的意义。

#### 1. 从“手写代码”到“Vibe Coding (氛围编程)”

在这个时代，你首先问的可能是“我是否需要从头手写这个逻辑？”

AI 辅助实现：在使用 Cursor 或 GitHub Copilot 等工具时，你可以直接输入注释：“// Merge two sorted arrays arr1 and arr2 without extra space using insertion sort approach”。AI 会迅速生成上述的双指针交换代码。
验证与迭代：我们的角色从“打字员”转变为“审稿人”。你需要检查 AI 生成的代码是否处理了边界条件（例如空数组、所有元素相同的情况），并评估其复杂度是否符合当前业务场景的性能指标。

#### 2. 性能监控与可观测性

在微服务架构中，这个合并逻辑可能位于一个高频交易的数据处理流水线上。

延迟敏感：如果 INLINECODE366cc48e 和 INLINECODE0e231cf0 达到 10万级别，O(nm) 的算法会造成明显的延迟尖刺（Latency Spike）。

指标埋点：我们不仅要写代码，还要在代码中嵌入监控。例如，使用 OpenTelemetry 记录 mergeArrays 函数的执行时间。

    // 伪代码示例：在 C++ 中添加监控埋点
    auto start = high_resolution_clock::now();
    mergeArraysInPlace(arr1, arr2);
    auto stop = high_resolution_clock::now();
    auto duration = duration_cast(stop - start);
    MetricsService::record("algorithm.merge.duration_us", duration.count());

#### 3. 技术债务的决策

你可能会问：“为什么不直接用最简单的 sort 方法？”

这是一个经典的工程权衡问题。

快速交付：如果是内部管理系统，数据量只有几百条，直接用“方法一”配合 std::sort 是最明智的选择。代码易读，不易出错，开发成本低。
长期维护：如果是底层 SDK 或者核心链路，我们必须选择 O(1) 空间复杂度的算法。此时的代码复杂度是为了换取运行时的性能红利。

我们的经验是：在 2026 年，随着硬件性能的提升，内存带宽往往比计算周期更宝贵。因此，减少内存分配（避免 O(n+m) 的临时数组）通常比减少 CPU 指令更有利于系统的整体吞吐量。

总结与展望

在这篇文章中，我们从最朴素的排序合并开始，逐步深入到了内存受限环境下的原地交换算法。这不仅是对算法能力的锻炼，更是对工程思维的打磨。

无论你是为了应对即将到来的技术面试，还是在实际项目中优化数据处理管道，理解这些底层原理都是不可或缺的。在未来的开发中，结合 AI 工具的辅助和深入的架构思考，你将能够写出更优雅、更高效的代码。

希望这次深入的探讨能给你带来新的启发。动手试一试这些代码，尝试修改输入值，观察输出变化，这是巩固学习最好的方式。我们下次再见！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客