内存管理初探：深入解析首次适应算法及其实现

2026-02-09 00:10:30 0条评论 22次阅读 0人点赞

在操作系统的核心课程中，内存管理无疑是最为基础且关键的一环。当我们面对有限的物理内存和多个并发进程时，如何高效、公平且安全地分配内存空间，就成了系统设计者必须面对的挑战。想象一下，你是一个繁忙图书馆的管理员，面对一排排大小不一的书架（内存块）和一堆叠厚度各异的书籍（进程），你的目标是找到一种策略，既能快速地把书放上去，又能最大限度地利用空间。

今天，我们将深入探讨动态分区分配中最直观、最常用的一种策略——首次适应算法。在这篇文章中，我们不仅会理解它的工作原理，还会通过实际代码来亲手实现它，分析它的优缺点，并讨论在真实开发场景中如何应对它可能带来的问题。无论你是正在准备系统架构面试，还是致力于编写高性能的后端服务，理解这些底层逻辑都将对你大有裨益。

什么是首次适应算法？

首次适应算法的逻辑非常直观，正如其名：“第一次遇到合适的就选它”。

当我们把内存看作一系列空闲块的集合时，为了给一个新到来的进程分配内存，算法会从内存的低地址开始（链表的头部），顺着顺序向后扫描。在这个过程中，它会将当前进程的大小与遇到的每一个空闲块进行比较。一旦找到第一个“大小 >= 进程大小”的空闲块，它就会立即停止搜索，将这块内存切割（如果剩余空间足够大，剩下的部分仍作为空闲块留作后用），并把前半部分分配给该进程。

这种策略充满了实用主义的智慧：它不追求完美，只追求“够用就好”，并且以最快的速度完成任务。

核心概念解析

在深入代码之前，让我们先通过一个具体的场景来模拟这个过程。这将有助于我们理清数据结构的变化。

#### 场景模拟

假设我们的计算机内存中有以下五个空闲分区（按地址顺序排列）：

Block 1: 100 KB
Block 2: 500 KB
Block 3: 200 KB
Block 4: 300 KB
Block 5: 600 KB

现在，我们有四个进程排队等待分配内存，它们的大小分别是：212 KB, 417 KB, 112 KB, 和 426 KB。让我们来看看首次适应算法是如何处理的：

进程 1 (212 KB):

– 扫描 Block 1 (100 KB) -> 不够 (100 < 212)。

– 扫描 Block 2 (500 KB) -> 够用！

– 结果: 分配 Block 2。Block 2 剩余空间变为 500 – 212 = 288 KB。

进程 2 (417 KB):

– 再次从头（或当前位置）开始扫描。

– Block 1 (100 KB) -> 不够。

– Block 2 (现余 288 KB) -> 不够 (288 < 417)。

– Block 3 (200 KB) -> 不够。

– Block 4 (300 KB) -> 不够。

– Block 5 (600 KB) -> 够用！

– 结果: 分配 Block 5。Block 5 剩余空间变为 183 KB。

进程 3 (112 KB):

– 继续扫描…

– Block 1 (100 KB) -> 不够。

– Block 2 (现余 288 KB) -> 够用！

– 结果: 分配 Block 2（这是之前进程 1 分配后剩下的部分）。Block 2 剩余空间变为 288 – 112 = 176 KB。

进程 4 (426 KB):

– 继续扫描…

– Block 1 (100 KB), Block 2 (176 KB), Block 3 (200 KB), Block 4 (300 KB), Block 5 (183 KB)。

– 悲剧发生了：虽然我们内存中剩余的总空间 (100+176+200+300+183 = 959 KB) 远大于进程 4 需求的 426 KB，但这些空间是破碎的，没有任何一个单独的连续块能装下它。

– 结果: Not Allocated (未分配)。

#### 为什么会发生这种情况？

这就是著名的外部碎片问题。首次适应算法倾向于在内存低地址留下大量难以利用的小空闲碎片。你可能会想：“如果我们把进程 1 放在 Block 4，进程 2 放在 Block 2，是不是就能腾出空间给进程 4 了？” 没错，这正是最佳适应算法试图解决的问题，但它付出的代价是更高的 CPU 搜索开销。在这个例子中，首次适应算法为了速度，牺牲了一定的空间利用率。

算法步骤详解

为了实现这个算法，我们可以将逻辑归纳为以下几个清晰的步骤：

初始化：输入内存块数组 INLINECODE8624755b 和进程大小数组 INLINECODEdba29ec9。我们需要一个数组 allocation 来记录每个进程最终分配到了哪个内存块的索引（初始化为 -1，表示未分配）。

遍历进程：选取每一个进程，开始寻找家。

遍历内存块：对于当前的进程，从第一个内存块开始向后扫描。

检查与分配：

– 检查公式：if (blockSize[j] >= processSize[i])。

– 如果条件成立：

– 记录分配：allocation[i] = j。

– 更新内存：blockSize[j] -= processSize[i]（这一步非常关键，它模拟了内存被切分的过程）。

– 立即跳出：break（找到第一个就停止，这是首次适应的核心特征）。

– 如果不成立：继续检查下一个内存块。

输出结果：遍历 allocation 数组，打印每个进程的分配状态。

深入代码实现

接下来，让我们看看如何将这些逻辑转化为高质量的代码。为了满足不同开发环境的需求，我将提供 C++ 和 C 语言的完整实现，并附上详细的中文注释。

#### 1. C++ 实现

C++ 的标准库为我们提供了方便的工具，使得代码更加简洁和现代化。

// C++ 实现：首次适应算法内存管理
#include 
#include 
#include  // 用于格式化输出

using namespace std;

// 函数：将内存块分配给进程
// 参数说明：
// blockSize: 存储当前每个内存块剩余大小的数组
// m: 内存块的数量
// processSize: 存储每个进程所需内存大小的数组
// n: 进程的数量
void firstFit(int blockSize[], int m, int processSize[], int n)
{
    // allocation数组用于存储分配结果
    // allocation[i] = j 表示第 i 个进程分配到了第 j 个块
    // 初始化为 -1 表示尚未分配
    int allocation[n];

    // 使用 memset 将数组全部初始化为 -1
    // 也可以使用 fill_n(allocation, n, -1);
    memset(allocation, -1, sizeof(allocation));

    // 逐个处理每一个进程
    for (int i = 0; i < n; i++)
    {
        // 为当前进程 i 寻找合适的内存块
        for (int j = 0; j = 进程 i 的需求
            if (blockSize[j] >= processSize[i])
            {
                // 找到了！分配块 j 给进程 i
                allocation[i] = j;

                // 非常重要：更新该内存块的剩余大小
                // 这反映了“切割”内存的过程
                blockSize[j] -= processSize[i];

                // 既然找到了第一个合适的，就不需要继续往后找了
                // 跳出内层循环，处理下一个进程
                break;
            }
        }
    }

    // --- 输出部分 ---
    cout << "
最终分配结果:
";
    cout << "-------------------------------------
";
    cout << left << setw(15) << "进程编号"
         << left << setw(15) << "进程大小"
         << left << setw(15) << "分配块编号" << endl;
    cout << "-------------------------------------
";

    for (int i = 0; i < n; i++)
    {
        cout << left << setw(15) << i + 1
             << left << setw(15) << processSize[i];
        
        if (allocation[i] != -1)
            cout << left << setw(15) << allocation[i] + 1; // 输出人类可读的编号（+1）
        else
            cout << left << setw(15) << "未分配";
            
        cout << endl;
    }
}

// 主函数：测试我们的算法
int main()
{
    // 示例数据
    int blockSize[] = {100, 500, 200, 300, 600};
    int processSize[] = {212, 417, 112, 426};
    int m = sizeof(blockSize) / sizeof(blockSize[0]);
    int n = sizeof(processSize) / sizeof(processSize[0]);

    // 调用算法
    firstFit(blockSize, m, processSize, n);

    return 0;
}

#### 2. C 语言实现

在嵌入式系统或操作系统内核开发中，C 语言依然是主流。这个版本展示了如何使用标准 C 库函数来实现同样的逻辑。

// C 实现：首次适应算法
#include 
#include  // 用于 memset

// 内存分配函数
void firstFit(int blockSize[], int m, int processSize[], int n)
{
    int i, j;
    // 分配数组，-1 代表未分配
    int allocation[n];

    // 初始化分配数组
    for(i = 0; i < n; i++)
    {
        allocation[i] = -1;
    }
  
    // 遍历所有进程 (n 是进程数量)
    for (i = 0; i < n; i++)
    {
        // 遍历所有内存块 (m 是内存块数量)
        for (j = 0; j = processSize[i])
            {
                // 记录分配的块索引
                allocation[i] = j;

                // 减少该块的可用内存
                blockSize[j] -= processSize[i];

                // 找到第一个合适的位置后立即跳出，去处理下一个进程
                break; 
            }
        }
    }

    // --- 输出格式化表格 ---
    printf("
--- 最终分配结果 ---
");
    printf("进程编号\t进程大小\t块编号
");
    
    for (i = 0; i < n; i++)
    {
        printf(" %d\t\t", i+1);
        printf("%d\t\t", processSize[i]);
        if (allocation[i] != -1)
            printf("%d", allocation[i] + 1);
        else
            printf("未分配");
        printf("
");
    }
}

// 驱动代码
int main()
{
    int m, n; 
    int blockSize[] = {100, 500, 200, 300, 600};
    int processSize[] = {212, 417, 112, 426};
    
    m = sizeof(blockSize) / sizeof(blockSize[0]);
    n = sizeof(processSize) / sizeof(processSize[0]);

    firstFit(blockSize, m, processSize, n);

    return 0;
}

#### 3. Python 实现与最佳实践

虽然系统底层通常用 C/C++，但在编写自动化测试脚本或快速原型验证时，Python 的便捷性无可替代。此外，我们可以使用列表推导式让代码更具“Pythonic”风格。

# Python 实现：首次适应算法
def first_fit(block_size, process_size):
    """
    实现首次适应算法
    :param block_size: 内存块列表 (会被修改以反映剩余空间)
    :param process_size: 进程大小列表
    """
    n = len(process_size)
    m = len(block_size)
    
    # 存储分配结果，-1 代表未分配
    allocation = [-1] * n

    # 遍历每个进程
    for i in range(n):
        for j in range(m):
            if block_size[j] >= process_size[i]:
                allocation[i] = j
                block_size[j] -= process_size[i]
                break # 找到即停止

    # 输出结果
    print("
进程编号\t进程大小\t块编号")
    for i in range(n):
        print(f"{i + 1}\t\t{process_size[i]}\t\t", end="")
        if allocation[i] != -1:
            print(allocation[i] + 1)
        else:
            print("未分配")

# 测试数据
if __name__ == "__main__":
    blocks = [100, 500, 200, 300, 600]
    processes = [212, 417, 112, 426]
    first_fit(blocks, processes)

实战应用与性能优化

仅仅写出代码是不够的，作为一名优秀的工程师，我们还需要思考算法在实际应用中的表现和优化方向。

#### 1. 优点：速度即正义

首次适应算法最大的优点就是分配速度快。

它不需要遍历整个内存链表，一旦找到合适位置就立刻返回。
在内存开始部分，往往容易聚集大量的小空闲块（碎片），这使得后续的较大进程更有可能跳过这些小碎片，直接找到后面的合适空间，这被称为“首部效应”或“聚集效应”。这在一定程度上保留了后面大块的空闲区，有利于大进程的分配。

#### 2. 缺点与优化：外部碎片

正如我们在例子中看到的，最大的痛点在于外部碎片。大量的内存因为无法连续拼接而被浪费。

解决方案：紧凑技术

你可以把这想象成整理书架：我们将所有已分配的书籍移到书架的一侧，将所有空白的区域移动到另一侧，从而合并成一个巨大的连续空闲块。在操作系统术语中，这叫做“紧凑”或“内存拼接”。这是一个开销巨大的操作，涉及大量的数据移动，通常在后台进行。实现紧凑技术需要硬件支持（重定位寄存器），以便在程序运行时动态调整其内存地址。

#### 3. 另一个优化思路：循环首次适应

如果我们不想做沉重的紧凑操作，可以稍微修改一下算法。

问题：由于每次都从链表头开始查找，低地址的小碎片会越来越多，导致每次分配都要费力地跨过这些“障碍物”。
优化：记录上一次分配结束的位置。下一次分配时，直接从那个位置继续往后找。当查到链表尾部时，再绕回头部。这就形成了一个循环查找。
效果：这使得内存分配更加均匀地分布在整个内存空间，减少了查找时的冗余比较，也一定程度上缓解了低地址碎片堆积的问题。

常见错误与调试技巧

在实现此类算法时，初学者常犯的错误包括：

忘记更新剩余空间：代码中写了 blockSize[j] -= processSize[i] 这一步至关重要。如果忘记写，系统会认为那块内存依然是满的，导致后续所有进程都能错误地使用这块内存，引发严重的逻辑错误（内存重叠）。
数组下标混淆：在输出时，记得给用户展示 Block No. + 1（因为人类习惯从1开始数），但在代码逻辑中要使用基于 0 的索引。
越界访问：务必确保循环变量 INLINECODEc141d40c 和 INLINECODE3a9892a1 严格小于 INLINECODE7fc505d9 和 INLINECODEb26150f5。

总结与后续步骤

今天，我们以一种循序渐进的方式，从问题定义、算法逻辑到具体的 C/C++/Python 代码实现，全方位地剖析了首次适应算法。它是理解操作系统内存管理的基石。

我们通过代码发现，虽然它在空间利用率上不是完美的（会产生外部碎片），但在时间效率上却表现优异。理解这种权衡，是系统架构设计的核心。

下一步建议：

我鼓励你基于今天的代码，尝试去实现最佳适应算法（Best Fit）或最差适应算法（Worst Fit），并对比它们在相同数据集下的表现（分配成功率和内存浪费程度）。这将进一步加深你对操作系统内存管理策略的理解。

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客