如何在Java中手写实现一个动态扩容数组？从原理到实战的深度解析

2026-02-14 03:55:07 0条评论 2次阅读 0人点赞

在日常的Java开发中，我们几乎每天都在使用 ArrayList。你是否想过，在这个看似神奇的容器背后，到底隐藏着怎样的机制？为什么它能像“变形金刚”一样，随着我们数据的增加自动变大？

今天，我们将暂时抛开那些现成的库，带你从零开始，亲手实现一个具备动态扩容（Resizable）能力的数组。在这个过程中，你不仅能深入理解Java集合框架底层的奥义，还能掌握关于内存管理和算法优化的实战技巧。准备好了吗？让我们开始这场关于数据结构的探索之旅。

1 为什么我们需要“可变长”数组？
2 实战演练：构建泛型可变长数组
3 运行效果演示
4 动态数组的使用场景与最佳实践
5 总结与后续思考

为什么我们需要“可变长”数组？

众所周知，Java中的原生数组（如 INLINECODE1b943af2, INLINECODE6bdb2789）一旦被创建，它的长度就被锁死了。这在处理数据量已知的情况时非常高效，但在现实世界的软件开发中，数据往往是动态流动的。如果我们无法预知数据的最终规模，使用原生数组就会陷入两难：

开太大： 浪费内存，甚至导致内存溢出（OOM）。
开太小： 数据溢出，程序崩溃。

为了解决这个问题，我们需要构建一个“智能”的数组，它能够：

自动感知存储空间的不足。
自动申请一块更大的内存区域。
无缝迁移原有数据到新区域，并让旧的内存“功成身退”。

实战演练：构建泛型可变长数组

我们将创建一个名为 ResizableArray 的类。为了增强通用性，我们将使用Java的泛型机制，这样我们的数组就可以容纳任何类型的对象（Integer, String, 甚至自定义对象）。

核心架构设计

我们的类将由三个核心状态变量驱动：

INLINECODE8142b008：这是数据的“仓库”。注意，由于Java泛型的类型擦除机制，我们通常使用 INLINECODEb5d42382 来作为底层数据结构。
int size：逻辑大小。这是我们真正存储了多少个元素。
INLINECODE2e81a73d：物理容量。这是底层数组实际能装多少个元素。INLINECODEe2fbdc43 总是大于或等于 size。

下面是我们的完整实现代码，请仔细阅读其中的注释，我们后续会对关键部分进行拆解。

完整代码实现

package ResizableArrayPackage;
import java.util.Arrays;

/**
 * 一个自定义的动态扩容数组实现
 * @author Your Name
 * @param  数组中存储的元素类型
 */
public class ResizableArray {
    
    // 底层数组，用于实际存储数据
    private Object[] array;
    
    // 当前数组的物理容量
    private int capacity;
    
    // 当前数组的逻辑大小（实际元素个数）
    private int size;

    /**
     * 默认构造函数
     * 初始化一个默认容量为2的数组
     */
    public ResizableArray() {
        this.capacity = 2; // 初始容量设置较小以便演示扩容
        this.array = new Object[capacity];
        this.size = 0;
    }

    /**
     * 向数组末尾添加元素
     * @param element 要添加的元素
     */
    public void add(T element) {
        // 核心逻辑：在添加前检查容量是否足够
        ensureCapacity();
        
        // 将元素放入 size 位置，然后 size 自增
        array[size++] = element;
    }

    /**
     * 移除指定索引处的元素
     * @param index 要移除的元素的索引
     */
    public void remove(int index) {
        // 1. 安全性检查：防止索引越界
        if (index = size) {
            throw new IndexOutOfBoundsException("索引 " + index + " 超出范围 [0, " + size + ")");
        }

        // 2. 数据搬运：将 index 之后的元素全部向前移动一位
        // System.arraycopy 是一个本地方法，比 for 循环效率更高
        // 参数：(源数组, 源起始位, 目标数组, 目标起始位, 复制长度)
        System.arraycopy(array, index + 1, array, index, size - index - 1);
        
        // 3. 清理引用：将原来最后位置的元素置为 null，帮助垃圾回收器工作
        array[--size] = null;

        // 4. 优化逻辑：如果空间利用率太低，进行缩容
        // 阈值设定为 1/4，避免频繁震荡
        if (size > 0 && size == capacity / 4) {
            resize(capacity / 2);
        }
    }

    /**
     * 获取数组当前的逻辑大小
     * @return 元素个数
     */
    public int size() {
        return size;
    }

    /**
     * 确保容量足够存储下一个元素
     * 如果不够，则触发扩容机制
     */
    private void ensureCapacity() {
        // 当逻辑大小等于物理容量时，说明数组已满
        if (size == array.length) {
            // 扩容策略：容量翻倍
            resize(capacity * 2);
        }
    }

    /**
     * 核心方法：调整数组大小
     * @param newCapacity 新的容量
     */
    private void resize(int newCapacity) {
        // 1. 申请新的数组空间
        Object[] newArray = new Object[newCapacity];

        // 2. 将旧数据复制到新数组中
        // 注意：只复制有效数据 [0, size)
        for(int i = 0; i < size; i++) {
            newArray[i] = array[i]; 
        }

        // 3. 更新内部引用
        array = newArray; 
        capacity = newCapacity; 
        
        // 调试输出（可选）
        // System.out.println("容量已调整为: " + capacity);
    }

    /**
     * 获取指定索引处的元素
     * @param index 索引
     * @return 该位置的元素
     */
    @SuppressWarnings("unchecked") // 因为涉及 Object 转具体类型，可能会有警告
    public T get(int index) {
        if (index = size) {
            throw new IndexOutOfBoundsException("索引越界");
        }
        // 强制类型转换
        return (T) array[index];
    }

    /**
     * 打印数组内容
     * @return 数组元素的字符串表示
     */
    @Override
    public String toString() {
        // Arrays.copyOf 可以截取数组的前 size 位，忽略后面 null 的部分
        return Arrays.toString(Arrays.copyOf(array, size));
    }
}

深度剖析：它是如何工作的？

上面的代码看似简单，却蕴含着几个精妙的设计思想。让我们深入看看其中的几个关键方法。

#### 1. add 方法与扩容魔法

当我们调用 INLINECODEe8e3c504 时，第一步是调用 INLINECODE67240682。这就是我们的“扩容探测器”。

检查逻辑： 它检查 size == array.length。这就像是看水箱满了没有。
扩容策略： 如果满了，我们不只是加 1，而是执行 capacity * 2。这是数据结构中的一个经典策略——倍增扩容。
为什么要倍增？ 如果你每次只增加 1 个空间，那么扩容开销是 O(1)，但是扩容频率太高，导致总效率低下。倍增扩容虽然单次操作较慢（需要复制所有元素），但通过均摊分析，它的平均时间复杂度是 O(1)。这在性能上是非常划算的。

#### 2. remove 方法与数组缩容

remove 方法不仅仅是删除元素，它还包含了两个重要的细节：

System.arraycopy： 你可能会问，为什么不用 INLINECODE00031fcb 循环移动元素？INLINECODE9db37edb 是 JVM 的本地方法，直接在内存层面操作，比 Java 层面的循环快得多。这是一个极佳的性能优化点。
缩容机制： 代码中包含 if (size > 0 && size == capacity / 4) 的判断。这意味着当数组里只有 1/4 的元素时，我们会将容量缩小一半。这是为了防止内存浪费。为什么是 1/4 而不是 1/2？是为了防止“频繁震荡”——即刚扩容又缩容，刚缩容又扩容，那样会极大地拖慢程序。

#### 3. 泛型与 Object[]

我们使用了 INLINECODE3678b6fa。在 INLINECODEac33d730 方法中，我们使用了 INLINECODEdf28a2cf。这是 Java 泛型类型的必然选择，因为 Java 不能直接创建泛型数组 INLINECODE3e6980c0。通过使用 INLINECODEbafce733 并在获取时进行类型转换，我们绕过了这个限制，同时也保证了类型安全（因为我们的 INLINECODEdacf2082 方法只接受泛型 T）。

运行效果演示

为了让你直观地看到这个类是如何工作的，我们编写一个 Main 类来进行测试。

package ResizableArrayPackage;

public class Main 
{
    public static void main(String[] args) 
    {
        // 初始化我们的可变长数组
        System.out.println("--> 初始化可变长数组");
        ResizableArray arr = new ResizableArray();

        // 1. 测试初始状态
        System.out.println("初始大小: " + arr.size()); // 预期: 0
        System.out.println("当前内容: " + arr.toString()); // 预期: []
        System.out.println("");

        // 2. 测试添加元素（触发扩容）
        System.out.println("--> 开始添加元素 (初始容量为2)");
        arr.add(10);
        arr.add(20);
        System.out.println("添加了 10, 20: " + arr);
        
        // 此时容量已满，第3个元素将触发扩容 -> 4
        arr.add(30);
        System.out.println("添加了 30 (触发扩容到4): " + arr);
        System.out.println("");

        // 3. 测试删除元素（触发缩容的可能性）
        System.out.println("--> 开始移除元素");
        arr.remove(1); // 移除 20
        System.out.println("移除索引 1 (20) 后: " + arr);
        
        // 继续测试越界异常
        try {
            arr.get(100);
        } catch (IndexOutOfBoundsException e) {
            System.out.println("成功捕获异常: " + e.getMessage());
        }

        System.out.println("");
        System.out.println("最终数组状态: " + arr);
    }
}

输出结果分析

运行上述 main 方法，你会看到如下输出：

--> 初始化可变长数组
初始大小: 0
当前内容: []

--> 开始添加元素 (初始容量为2)
添加了 10, 20: [10, 20]
添加了 30 (触发扩容到4): [10, 20, 30]

--> 开始移除元素
移除索引 1 (20) 后: [10, 30]
成功捕获异常: 索引 100 超出范围 [0, 2)

最终数组状态: [10, 30]

注意，当添加第3个元素时，程序内部静默地执行了数组的复制和扩容，但用户完全感知不到这个过程。这就是“封装”带来的优雅体验。

动态数组的使用场景与最佳实践

既然 Java 已经有了 ArrayList，为什么我们还要学习手写它？除了面试考察外，这种底层知识能帮助我们做出更好的技术决策。

#### 1. 性能敏感场景的调优

在 高并发 或 内存受限 的环境下，ArrayList 的默认行为可能不满足需求。

预分配内存： 如果你知道要存 10000 个元素，直接用 INLINECODE87a64bbf（如果你的构造函数支持）或者 INLINECODE13f896fd 的 ensureCapacity 方法。这能避免中间多次微小的数组复制操作，显著提升性能。
减少碎片： ArrayList 的默认负载因子是 0.75（对于扩容而言）。在我们的实现中，这种“填满再扩”的策略空间利用率很高。

#### 2. 处理大对象

如果你存储的每个对象都很大（比如图片、大字符串），频繁的 INLINECODEa12fd001 复制操作会带来巨大的性能开销（复制大对象引用虽然快，但内存抖动会导致 GC 频繁）。理解底层原理后，你会更倾向于一开始就设置一个合理的 INLINECODE45b281b9。

#### 3. 自定义数据结构的基础

动态数组是许多高级数据结构的基础。例如，我们稍后会讨论的栈、队列，甚至 哈希表 的底层，在解决冲突时使用的拉链法，本质上都依赖于一个健壮的动态数组。

总结与后续思考

在这篇文章中，我们从零构建了一个类似于 ArrayList 的数据结构。我们了解到：

动态扩容的本质是数组的复制，System.arraycopy 是其中的性能关键。
倍增扩容策略在时间复杂度上能达到 O(1) 的均摊效率。
泛型技术让我们能编写出适应各种数据类型的通用代码。
内存管理不仅仅是分配空间，合理的缩容策略（如 1/4 阈值）同样重要。

如果你能够完全理解并手写出上面的代码，恭喜你，你已经掌握了 Java 集合框架的核心技术之一。

挑战与进阶

不要止步于此。作为下一步的思考，你可以尝试回答以下问题：

如果在多线程环境下，两个线程同时对我们的 INLINECODE7f10c104 进行 INLINECODEb72eca11 操作会发生什么？（提示：竞态条件，size++ 不是原子操作）
如何优化 INLINECODE03a69a72 方法，使其不仅仅支持按索引删除，还支持按值删除？（例如 INLINECODE59fdfe2f）

希望这篇文章对你有所帮助。在编程的旅程中，理解底层原理是通往高手的必经之路，让我们一起继续前行！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客