图论算法深度解析：掌握深度优先搜索（DFS）的原理与实现

2026-02-04 02:12:35 0条评论 50次阅读 0人点赞

在算法的世界里，图的遍历是解决许多复杂问题的基石。作为一名开发者，你可能在处理网络拓扑、社交关系分析或者游戏中的地图寻路时，都需要与图打交道。今天，让我们深入探讨图论中最基础也最重要的算法之一：深度优先搜索（Depth First Search，简称 DFS）。

这篇文章不仅会带你理解 DFS 的工作原理，我们还会一起通过实际的代码示例来掌握它，了解如何优雅地处理回溯、避免死循环，以及如何在实际项目中优化这一算法。无论你是正在准备面试，还是想在工程实践中应用图算法，这篇深度解析都将为你提供坚实的理论基础和实战经验。

什么是深度优先搜索（DFS）？

想象一下，你身处一个巨大的迷宫之中。你的目标是探索迷宫的每一个角落。有两种基本的策略：一种是每次遇到岔路口都选择一条路一直走到黑，直到走不通了再退回来换另一条路；另一种是像地毯式搜索一样，先搜索完附近所有的区域，再向远处扩展。

深度优先搜索（DFS）就是前者。正如其名，“深度”优先。这种算法会从源顶点出发，沿着一条路径尽可能深地探索，直到到达无法继续的节点，然后回溯（Backtrack）到上一个岔路口，探索其他未访问的路径。

#### 核心思想

为了让你更清晰地理解，让我们拆解一下 DFS 的核心逻辑：

起点开始：从指定的起始节点开始。
标记与访问：一旦访问了某个节点，立即将其标记为“已访问”，防止后续重复处理。这是处理包含环的图的关键。
递归探索：遍历当前节点的所有邻接点。对于每一个未被访问的邻接点，重复上述过程。
自动回溯：当一个节点的所有邻接点都被访问过后，函数自然会返回（回溯）到调用它的上一层，继续探索其他路径。

#### 为什么需要“访问数组”？

在处理树结构时，我们往往不需要访问数组，因为树没有环。但在图中，节点之间可能存在复杂的回路。如果我们不记录哪些节点已经去过，算法可能会陷入死循环，在两个节点之间无限往返。因此，维护一个布尔类型的 visited[] 数组是 DFS 实现中的标配。

算法演示：DFS 如何工作？

为了让你直观地感受这个过程，让我们通过一个具体的例子来一步步拆解。

#### 示例场景 1

假设我们有一个如下的图结构（邻接表表示）：

输入：adj[][] = [[1, 2], [0, 2], [0, 1, 3, 4], [2], [2]]

这意味着节点 0 连着 1 和 2；节点 1 连着 0 和 2，以此类推。我们设定节点 0 为起点。

执行步骤推演：

起始点 0：标记 0 为已访问。结果列表 [0]。
移动到 1：0 的邻接点是 [1, 2]。假设按顺序选择，先去 1。标记 1 为已访问。结果 [0, 1]。
移动到 2：1 的邻接点是 [0, 2]。0 已经访问过了，所以去 2。标记 2 为已访问。结果 [0, 1, 2]。
移动到 3：2 的邻接点是 [0, 1, 3, 4]。0, 1 已访问。前往 3。标记 3 为已访问。结果 [0, 1, 2, 3]。
回溯到 2：3 没有未访问的邻接点（只连着 2）。函数返回，回溯到 2。
移动到 4：回到 2 后，检查下一个邻接点 4。标记 4 为已访问。结果 [0, 1, 2, 3, 4]。
结束：4 的邻接点只有 2（已访问）。回溯到 2，再回溯到 1，最后回溯到 0。所有节点访问完毕。

最终输出： [0, 1, 2, 3, 4]
注意：根据邻接表存储顺序的不同（比如你先访问 2 再访问 1），DFS 的结果可能会有多种变体。图的 DFS 遍历结果往往不是唯一的。

#### 示例场景 2：非连通图的处理

如果图中存在孤岛（即两个部分互不相连），从单一源点出发的 DFS 可能无法遍历所有节点。让我们看下面的例子：

输入：adj[][] = [[2, 3], [2], [0, 1], [0], [5], [4]]

节点 0, 1, 2, 3 互连，而节点 4 和 5 单独互连，与 0-3 组断开。

执行步骤推演：

组内遍历：从 0 开始 -> 2 -> 1（回溯）-> 3（回溯）。此时结果为 [0, 2, 1, 3]。0 的所有邻居都处理完了。
外部节点：虽然我们在 main 函数里通常手动调用一次 DFS，但在实际处理未知拓扑的图时，为了覆盖所有节点，我们需要循环检查所有节点。如果发现某个节点未被访问（比如 4），即使它不在 0 的可达范围内，我们也要对它启动一次新的 DFS。
孤岛遍历：从 4 开始 -> 5（回溯）。结果追加 [4, 5]。

最终输出： [0, 2, 1, 3, 4, 5]

代码实现：从 C++ 到 Java

理解了原理之后，让我们动手写代码。为了适应不同的开发环境和需求，我将为你展示 C++、C 和 Java 三种语言的实现。

#### 1. C++ 实现（递归法）

C++ 的标准模板库（STL）提供了强大的 vector，非常适合构建邻接表。利用递归，我们可以写出极其简洁的 DFS 代码。

#include 
#include 
using namespace std;

// 递归辅助函数
// adj: 邻接表，visited: 访问标记数组，s: 当前节点，res: 存储遍历结果
void dfsRec(vector<vector> &adj, vector &visited, int s, vector &res) {
    // 标记当前节点为已访问
    visited[s] = true;
    // 将当前节点加入结果列表
    res.push_back(s);

    // 遍历所有邻接点
    // 这里的引用循环遍历了 s 的所有邻居
    for (int neighbor : adj[s]) {
        // 如果邻居未被访问，则递归调用
        if (visited[neighbor] == false) {
            dfsRec(adj, visited, neighbor, res);
        }
    }
}

// DFS 的主封装函数
vector dfs(vector<vector> &adj) {
    // 初始化访问数组，大小为节点总数，初始值为 false
    vector visited(adj.size(), false);
    vector res;
    
    // 注意：这里假设图是连通的，直接从 0 开始。
    // 对于非连通图，外层通常需要循环来确保覆盖所有节点。
    dfsRec(adj, visited, 0, res);
    return res;
}

// 辅助函数：添加边（构建无向图）
void addEdge(vector<vector>& adj, int u, int v) {
    adj[u].push_back(v);
    adj[v].push_back(u); // 无向图需要双向添加
}

int main() {
    int V = 5; // 节点数量
    vector<vector> adj(V);
    
    // 构建图结构
    addEdge(adj, 1, 2);
    addEdge(adj, 1, 0);
    addEdge(adj, 2, 0);
    addEdge(adj, 2, 3);
    addEdge(adj, 2, 4);
    
    // 执行 DFS
    vector res = dfs(adj); 

    // 输出结果
    cout << "DFS 遍历顺序: ";
    for (int i : res)
        cout << i << " ";
    
    return 0;
}

#### 2. C 语言实现（邻接矩阵法）

在 C 语言中，处理动态数组相对繁琐，因此我们使用邻接矩阵来表示图。这种方式代码逻辑更直观，适合理解底层操作，但空间复杂度较高（O(V^2)）。

#include 

#define V 5

// 递归辅助函数
// adj: 邻接矩阵，visited: 访问数组，s: 当前节点，res: 结果数组，idx: 结果数组的当前索引指针
void dfsRec(int adj[V][V], int visited[V], int s, int res[V], int *idx) {
    visited[s] = 1; // 标记已访问
    res[(*idx)++] = s; // 存入结果并移动索引

    // 遍历所有可能的节点 (0 到 V-1)
    for (int i = 0; i < V; i++) {
        // 检查是否存在边 且 节点未被访问
        if (adj[s][i] && visited[i] == 0) {
            dfsRec(adj, visited, i, res, idx);
        }
    }
}

// DFS 主函数
void dfs(int adj[V][V], int res[V]) {
    int visited[V] = {0}; // 初始化所有节点为未访问
    int idx = 0;
    dfsRec(adj, visited, 0, res, &idx);
}

// 辅助：添加边
void addEdge(int adj[V][V], int u, int v) {
    adj[u][v] = 1;
    adj[v][u] = 1; // 无向图
}

int main() {
    int adj[V][V] = {0}; // 初始化全0矩阵

    // 构建图
    addEdge(adj, 1, 2);
    addEdge(adj, 1, 0);
    addEdge(adj, 2, 0);
    addEdge(adj, 2, 3);
    addEdge(adj, 2, 4);

    int res[V];
    
    dfs(adj, res);

    printf("DFS 遍历顺序: ");
    for (int i = 0; i < V; i++)
        printf("%d ", res[i]);

    return 0;
}

#### 3. Java 实现（面向对象）

Java 提供了丰富的集合框架。我们使用 ArrayList 来存储邻接表，这在处理稀疏图时比矩阵更高效。

import java.util.ArrayList;

class GraphTraversal {

    // 递归函数
    static void dfsRec(ArrayList<ArrayList> adj, int[] visited, int s, ArrayList res) {
        // 标记为已访问（这里用数组代替 Boolean 对象以提高效率）
        visited[s] = 1;
        
        // 将节点加入结果
        res.add(s);

        // 遍历邻居
        for (int neighbor : adj.get(s)) {
            if (visited[neighbor] == 0) {
                dfsRec(adj, visited, neighbor, res);
            }
        }
    }

    static ArrayList dfs(ArrayList<ArrayList> adj, int V) {
        // 使用 int 数组作为访问标记，初始值为 0
        int[] visited = new int[V];
        ArrayList res = new ArrayList();
        
        // 同样，这里演示从节点 0 开始的情况
        dfsRec(adj, visited, 0, res);
        return res;
    }

    public static void main(String[] args) {
        int V = 5;
        ArrayList<ArrayList> adj = new ArrayList();
        
        // 初始化邻接表
        for (int i = 0; i < V; i++) {
            adj.add(new ArrayList());
        }
        
        // 添加边
        addEdge(adj, 1, 2);
        addEdge(adj, 1, 0);
        addEdge(adj, 2, 0);
        addEdge(adj, 2, 3);
        addEdge(adj, 2, 4);
        
        ArrayList result = dfs(adj, V);
        
        System.out.println("DFS 遍历顺序: " + result);
    }

    // 辅助添加边的方法
    static void addEdge(ArrayList<ArrayList> adj, int u, int v) {
        adj.get(u).add(v);
        adj.get(v).add(u);
    }
}

深入分析与最佳实践

作为一个经验丰富的开发者，仅仅知道“怎么写”是不够的，我们还需要知道“怎么写更好”以及“在什么场景下用”。

#### 复杂度分析

在面试或系统设计中，分析算法的时空复杂度是必修课。

时间复杂度：O(V + E)

* V：顶点的数量。每个顶点最多被访问一次（入栈一次），所以是 O(V)。

* E：边的数量。在递归过程中，我们会遍历邻接表中的所有边来检查邻居。虽然对于每条边（无向图）我们可能会检查两次（分别从两个端点），但总体上是线性的 O(E)。

* 因此，总的时间复杂度是 O(V + E)。这是图算法中非常理想的效率。

空间复杂度：O(V)

* visited 数组：需要 O(V) 的空间。

* 递归调用栈：这是隐性开销。在最坏情况下（例如一条链状的图），递归深度会达到 V，因此栈空间也是 O(V)。

* 结果存储：如果需要存储遍历结果，也需要 O(V) 空间。

* 总体空间消耗主要由图的结构和递归深度决定。

#### 迭代式 DFS：用显式栈替代递归

虽然递归代码很优雅，但在生产环境中，如果图非常深（例如深度超过 10 万），递归可能会导致栈溢出。为了解决这个问题，我们可以使用迭代法，即显式地维护一个栈数据结构来模拟递归过程。

迭代式实现思路：

将源节点压入栈。
当栈不为空时，弹出栈顶元素。
如果该元素未被访问，标记为已访问并处理。
将该元素的所有未访问邻接点压入栈中。

注意*：为了保持与递归类似的访问顺序（通常是先访问右侧节点），我们可以按反向顺序或特定顺序将邻接点入栈。

#### DFS 的实际应用场景

DFS 不仅仅是遍历工具，它还是许多高级算法的核心：

连通性检测：判断图中的两个节点是否相连，或者图中有多少个连通分量。
拓扑排序：在任务调度或课程依赖关系中，确定执行顺序。通常基于 DFS 的后序遍历。
路径查找：在迷宫游戏中寻找从起点到终点的路径。
环的检测：判断一个有向图中是否存在死锁或依赖环。
强力搜索与回溯算法：如数独求解、八皇后问题。这类问题本质上也是在解空间树上进行 DFS。

总结与后续建议

在这篇文章中，我们深入探讨了图的深度优先搜索算法。我们从 DFS 的基本直觉——“不撞南墙不回头”讲起，详细分析了其核心逻辑和避免死循环的 visited 机制。通过手写 C++、C 和 Java 的代码示例，你应该已经掌握了如何在邻接表和邻接矩阵下实现 DFS。

关键要点总结：

DFS 是一种利用递归或栈实现的遍历算法。
记得始终使用访问数组来处理图中的环。
DFS 的时间复杂度为 O(V + E)，空间复杂度主要受递归深度影响。
在处理深度极大的图时，考虑使用迭代式 DFS 以防止栈溢出。

如果你想继续精进，建议你下一步尝试广度优先搜索（BFS），对比一下它“层层递进”的遍历方式与 DFS 有何不同。此外，尝试在二叉树结构中应用 DFS（前序、中序、后序遍历），将会让你对这一算法有更深刻的体会。

希望这篇深度解析能帮助你真正掌握 DFS。快去代码编辑器中尝试一下吧！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客