深入浅出 Python 图论：从数据结构到实战应用

2026-02-05 13:38:02 0条评论 3次阅读 0人点赞

在日常的编程挑战中，你是否曾遇到过诸如“最短路径”、“社交网络分析”或“依赖关系解析”这类看似棘手的问题？这些问题的核心往往都指向同一种强大的数据结构——图。在这篇文章中，我们将深入探讨 Python 中图的世界，从最基础的概念讲起，带你一步步理解什么是图、如何用代码表示它们，以及如何根据不同的场景选择最优的实现方式。无论你是数据科学的新手，还是寻求优化的资深开发者，掌握图数据结构都将是你技术武器库中的重要一环。

1 什么是图？
2 图的表示方法：如何在计算机中存储图？
3 邻接矩阵 vs 邻接表：如何选择？
4 图的基本操作与性能考量
5 总结

什么是图？

简单来说，图是一种非线性数据结构。它不像数组或链表那样是线性的，而是由一组顶点和一组边组成的复杂网络。顶点有时也被称为节点，而边则是连接图中任意两个节点的线或弧。更正式地说，图由一组顶点和一组边组成，数学上通常表示为 G(V, E)。

为了让你更直观地理解，让我们想象一场激烈的足球比赛。如果把球场看作一张巨大的图，每一位球员就是一个节点，而他们之间的传球互动、跑位配合就是连接这些节点的边。这种“连接网络”正是图数据结构所表示的核心内容。通过图，我们不仅能看到数据本身，还能解锁数据之间隐藏的深层关系和动态洞察。

图的核心组成

在开始编码之前，我们需要先明确两个核心概念，就像我们在写代码前需要明确变量类型一样重要：

顶点： 顶点是图的基本单位。每个顶点可以代表一个实体，比如地图上的城市、社交网络中的用户，或者刚才提到的足球场上的球员。它们可以是带有具体信息的，也可以是简单的标识符。
边：边用于连接图中的两个节点。在无向图中，它是无序的（比如朋友关系）；在有向图中，它是节点之间的有序对（比如关注关系）。边也可以带有“权重”，比如两个城市之间的距离。

图的表示方法：如何在计算机中存储图？

理解了概念，下一步就是如何把这些逻辑结构存进计算机的内存里。在 Python 中，我们主要有两种最常见的方式来表示图：邻接矩阵和邻接表。选择哪种方式，取决于你的图有多稠密以及你需要进行什么样的操作。

1. 邻接矩阵表示法

邻接矩阵就像是我们在上学时坐的教室座位表。我们使用一个二维矩阵（在 Python 中通常是二维列表），其中行和列分别代表图中的顶点。矩阵中的每个条目表示这两个顶点之间是否存在边，如果是带权图，这个条目就代表边的权重。

这种方法特别适合稠密图，即图中顶点之间的边非常多的情况。

#### 代码实现：邻接矩阵

让我们通过一段 Python 代码来看看如何在实践中构建一个邻接矩阵。我们将实现一个无向图，这意味着边是双向的，所以矩阵是对称的。

# 定义一个函数来添加边，构建无向图
def add_edge(mat, i, j):
    # 添加一条连接顶点 i 和顶点 j 的边
    # 因为我们实现的是无向图，所以矩阵是对称的
    mat[i][j] = 1  # 设置 i 到 j 的连接
    mat[j][i] = 1  # 设置 j 到 i 的连接

def display_matrix(mat):
    """辅助函数：以更友好的格式打印矩阵"""
    print("
当前邻接矩阵结构:")
    for row in mat:
        # 将整数转换为字符串并用空格连接，方便查看
        print(" ".join(map(str, row)))

# 主程序入口
if __name__ == "__main__":
    # 定义图中顶点的数量，假设有 4 个节点 (0, 1, 2, 3)
    V = 4
    # 初始化一个 V x V 的二维列表，初始值均为 0（表示没有边）
    # 这里使用了列表推导式来快速创建矩阵
    mat = [[0] * V for _ in range(V)]

    # 开始构建图的连接关系
    # 添加边：0-1, 0-2, 1-2, 2-3
    add_edge(mat, 0, 1)
    add_edge(mat, 0, 2)
    add_edge(mat, 1, 2)
    add_edge(mat, 2, 3)

    # 打印最终的邻接矩阵
    display_matrix(mat)

代码运行输出：

当前邻接矩阵结构:
0 1 1 0
1 0 1 0
1 1 0 1
0 0 1 0

深度解析：

在这个输出中，第 0 行第 1 列的值是 INLINECODEc60bdafe，这意味着节点 0 和节点 1 之间有直接连接。注意对角线（比如 INLINECODE6c632e54）通常是 0，除非节点自己连接自己（自环）。邻接矩阵的优点是查询非常快，我们可以在 O(1) 的时间内判断两个节点是否相连。但是，它的缺点也很明显：空间浪费。即便两个节点之间没有边，我们也要在矩阵中为它分配一个存储空间（值为 0）。如果节点数 N 很大，比如 10000，那么我们需要一个 10000 x 10000 的矩阵，这在内存中是非常昂贵的。

2. 邻接表表示法

为了解决邻接矩阵的空间浪费问题，我们来看看邻接表。你可以把它想象成“通讯录”。对于图中的每一个节点，我们都维护一个列表，里面记录了它直接相连的所有邻居。

这种方法特别适合稀疏图，即边数远小于节点数的平方的情况。它是图表示中更通用的方式。

#### 代码实现：邻接表

在 Python 中，我们可以使用列表的列表，或者字典来实现邻接表。为了性能考虑，实际工程中我们通常结合字典和集合，但为了演示清晰，我们先使用列表的列表。

def add_edge(adj, i, j):
    """
    邻接表添加边的函数
    adj: 邻接表数据结构
    i, j: 要连接的两个顶点索引
    """
    adj[i].append(j)  # 将 j 添加到 i 的邻居列表中
    adj[j].append(i)  # 因为是无向图，也要将 i 添加到 j 的邻居列表中

def display_adj_list(adj):
    """辅助函数：打印邻接表"""
    print("
当前邻接表结构:")
    for i in range(len(adj)):
        # 打印每个节点及其相连的所有邻居
        print(f"节点 {i} 连接到 ->: {adj[i]}")

# 主程序
if __name__ == "__main__":
    V = 4  # 顶点数量
    # 初始化邻接表，创建 V 个空列表
    adj = [[] for _ in range(V)]

    # 构建相同的图结构：0-1, 0-2, 1-2, 2-3
    add_edge(adj, 0, 1)
    add_edge(adj, 0, 2)
    add_edge(adj, 1, 2)
    add_edge(adj, 2, 3)

    # 显示邻接表
    display_adj_list(adj)

代码运行输出：

当前邻接表结构:
节点 0 连接到 ->: [1, 2]
节点 1 连接到 ->: [0, 2]
节点 2 连接到 ->: [0, 1, 3]
节点 3 连接到 ->: [2]

深度解析：

看这个输出，我们可以清楚地看到每个节点的“朋友圈”。例如，节点 0 连接到 1 和 2。邻接表非常节省空间，因为它只存储实际存在的边。然而，它的一个潜在缺点是，如果你想知道节点 A 和节点 B 是否相连，你必须遍历节点 A 的邻居列表，这在最坏情况下的时间复杂度是 O(N)，而在邻接矩阵中只需要 O(1)。

深入实战：使用字典和集合优化邻接表

上面的列表实现虽然直观，但在处理复杂图（例如需要检查边是否存在或处理重复边）时可能效率不高。在 Python 实战中，我们通常推荐使用字典（映射节点）和集合（存储邻居）的组合。这样不仅查找速度更快，还能自动处理重复边的问题。

class Graph:
    def __init__(self):
        # 使用字典来存储邻接表，键是节点，值是邻居集合
        self.adj_list = {}

    def add_edge(self, u, v):
        """添加边（处理无向图）"""
        if u not in self.adj_list:
            self.adj_list[u] = set()
        if v not in self.adj_list:
            self.adj_list[v] = set()
        
        # 添加到集合中，自动去重
        self.adj_list[u].add(v)
        self.adj_list[v].add(u)

    def display(self):
        for node in self.adj_list:
            print(f"节点 {node}: {self.adj_list[node]}")

# 使用示例
if __name__ == "__main__":
    g = Graph()
    g.add_edge(‘A‘, ‘B‘)
    g.add_edge(‘A‘, ‘C‘)
    g.add_edge(‘B‘, ‘C‘)
    g.add_edge(‘B‘, ‘D‘)
    # 尝试添加重复边
    g.add_edge(‘A‘, ‘B‘)
    
    print("优化后的邻接表（使用集合防止重复）:")
    g.display()

输出：

优化后的邻接表（使用集合防止重复）:
节点 A: {‘B‘, ‘C‘}
节点 B: {‘A‘, ‘C‘, ‘D‘}
节点 C: {‘A‘, ‘B‘}
节点 D: {‘B‘}

邻接矩阵 vs 邻接表：如何选择？

作为开发者，我们经常需要在不同的实现方式之间做权衡。让我们详细对比一下这两种方法，以便你能在实际工作中做出最佳决策。

操作/特性

邻接矩阵

邻接表 :—

:—

:— 空间复杂度

O(V^2)。无论有多少边，总是占用固定的平方级空间。

O(V + E)。与边数成正比，适合稀疏图，节省内存。 添加边

O(1)。只需要直接修改矩阵中的值。

O(1)。在列表尾部添加元素通常很快。 删除边

O(1)。直接置零。

O(N)。在最坏情况下，可能需要遍历列表才能找到并删除边。 判断两节点是否相连

O(1)。直接访问 mat[i][j]。

O(degree(V))。需要遍历邻居列表。 适用场景

稠密图，频繁查询边是否存在，使用 Floyd-Warshall 或 Prim 算法时。

稀疏图，如社交网络、网页链接，追求空间效率时。

图的基本操作与性能考量

在实际应用中，除了存储图，我们还需要对图进行操作。以下是一些最基础但也最重要的操作，以及我们在 Python 中实现它们时的注意事项。

1. 插入顶点和边

我们在上面的例子中已经展示了如何插入边。插入顶点在邻接表中是隐式的（当你向一个未知的节点添加边时），但在邻接矩阵中，你需要重新定义一个更大的矩阵，这在 Python 中开销巨大。因此，对于动态增长的图，邻接表永远是首选。

2. 图的遍历（实战核心）

虽然原草稿未详细展开，但我认为作为补充，了解如何遍历图至关重要。图最常见的遍历方式有两种：广度优先搜索（BFS）和深度优先搜索（DFS）。

#### 实战示例：BFS 寻找最短路径

假设我们要找从节点 A 到节点 B 的最少跳数（例如在 LinkedIn 上找二度人脉），BFS 是最佳选择。

from collections import deque

def bfs_shortest_path(graph, start, goal):
    """
    使用 BFS 在无权图中寻找最短路径
    graph: 邻接表字典 {node: [neighbors]}
    """
    # 记录访问过的节点，防止死循环
    visited = set()
    # 队列存储 (当前节点, 路径历史)
    queue = deque([(start, [start])])
    
    while queue:
        current_vertex, path = queue.popleft()
        
        # 如果找到目标
        if current_vertex == goal:
            return path
            
        # 如果节点未被访问
        if current_vertex not in visited:
            visited.add(current_vertex)
            
            # 获取所有邻居并加入队列
            # 如果邻居未在当前路径中，防止环
            for neighbor in graph.get(current_vertex, []):
                if neighbor not in path:
                    queue.append((neighbor, path + [neighbor]))
    
    return None  # 未找到路径

# 测试数据
graph_example = {
    ‘A‘: [‘B‘, ‘C‘],
    ‘B‘: [‘A‘, ‘D‘, ‘E‘],
    ‘C‘: [‘A‘, ‘F‘],
    ‘D‘: [‘B‘],
    ‘E‘: [‘B‘, ‘F‘],
    ‘F‘: [‘C‘, ‘E‘]
}

path = bfs_shortest_path(graph_example, ‘A‘, ‘F‘)
print(f"从 A 到 F 的最短路径是: {path}")
# 输出可能是: [‘A‘, ‘C‘, ‘F‘] 或 [‘A‘, ‘B‘, ‘E‘, ‘F‘] (取决于边的添加顺序)

常见错误与最佳实践

在处理 Python 图结构时，新手（甚至是有经验的开发者）常会遇到以下陷阱：

可变性陷阱： 在使用邻接矩阵时，如果你使用了 INLINECODE32295a3f 来初始化矩阵，你会发现修改一行会影响所有行！这是因为 Python 复制的是列表的引用。最佳实践： 始终使用列表推导式 INLINECODE1d251c82。
递归深度： 在使用深度优先搜索（DFS）处理极大的图时，Python 默认的递归深度限制（通常为 1000）可能会被触发。解决方案： 使用显式的栈结构来代替递归，或者使用 sys.setrecursionlimit。
忽略孤岛： 图并不总是完全连通的。在遍历时，记得对未访问的节点也进行循环检查，以确保覆盖了图中的所有“孤岛”组件。

总结

在这篇文章中，我们一起从零构建了 Python 中图的数据结构。我们学习了图的基本定义，对比了邻接矩阵（适合稠密图、快速查询）和邻接表（适合稀疏图、节省空间）的区别，并通过实际的代码案例看到了如何在 Python 中优雅地实现它们。

掌握这些基础知识后，你就可以自信地面对更复杂的算法挑战，比如最小生成树、Dijkstra 最短路径算法，以及网络流分析等。图算法的世界博大精深，但一切都始于这一个个的节点和边。希望你能在接下来的项目中，尝试使用这些技巧来优化你的数据关系处理！

下一步建议： 尝试使用 Python 的 networkx 库来可视化你构建的图，这将帮助你更直观地理解算法的运行过程。祝编码愉快！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客