深入解析图论中的并集与交集：算法原理与实战代码指南

2026-02-01 04:53:59 0条评论 74次阅读 0人点赞

在图论的实际应用中，我们经常需要处理多个图之间的关系，比如比较两个网络拓扑结构的差异，或者合并两个不同的数据集。这时，我们就需要用到图的并集和交集操作。在这篇文章中，我们将深入探讨这两个概念，通过生动的例子和详细的代码实现，带你一步步掌握如何在两个图之间执行这些操作。无论你是在做算法竞赛，还是在处理复杂的网络数据，这篇文章都会为你提供实用的见解和解决方案。

1. 问题定义：什么是图的并集与交集？

首先，让我们明确一下我们到底在解决什么问题。给定两个图，我们称之为 G1 和 G2。我们的目标是生成两个新的图：

并集图 (G1 ∪ G2)：这个图包含了 G1 和 G2 中所有的边。如果在两个图中都存在相同的边（即连接相同的顶点对），在结果图中我们只需要保留一份。
交集图 (G1 ∩ G2)：这个图只包含那些同时存在于 G1 和 G2 中的边。如果一条边只在 G1 或者只在 G2 中出现，它就不会出现在交集中。

为了让你更直观地理解，让我们看一个具体的例子。

假设我们有两个图 G1 和 G2，它们的边集如下（注意：这里假设是无向图，边 (1, 2) 和 (2, 1) 被视为相同）。

G1 的边: {("e1", 1, 2), ("e2", 1, 3), ("e3", 3, 4), ("e4", 2, 4)}
G2 的边: {("e4", 2, 4), ("e5", 2, 5), ("e6", 4, 5)}

执行并集操作 (G1 ∪ G2)：

我们会把 G1 的所有边先放进去，然后检查 G2 的边。你会发现 G2 的第一条边 ("e4", 2, 4) 已经在 G1 里了，所以我们跳过它。接着我们把 ("e5", 2, 5) 和 ("e6", 4, 5) 加进去。

输出：

G1 union G2 is
e1 1 2
e2 1 3
e3 3 4
e4 2 4
e5 2 5
e6 4 5

执行交集操作 (G1 ∩ G2)：

我们只保留那些两边都有的边。检查发现，只有边 ("e4", 2, 4) 是同时存在于两个图中的。

输出：

G1 intersection G2 is
e4 2 4

2. 核心算法设计与思路

了解了基本概念后，让我们来看看如何用代码来实现这个逻辑。这里的关键在于如何高效地判断一条边是否已经存在。我们将使用哈希映射或者字典（在 C++ 中是 INLINECODE2c314060 或 INLINECODE57973b5c）来存储已经访问过的边，以实现快速查找。

#### 2.1 求并集的思路

初始化：我们需要一个容器（比如动态数组 INLINECODE8426413e）来存储最终的结果图，同时需要一个 INLINECODEa5ced913 来记录已经加入的边，以防重复。
处理 G1：遍历 G1 的所有边。对于每一条边，我们直接将其加入结果图，并在 map 中标记这条边已经存在。这里的关键是，因为图可能是无向的，我们需要同时检查 (u, v) 和 (v, u)。
处理 G2：遍历 G2 的所有边。对于每一条边，我们先去 INLINECODE199d548b 里查一下它是否已经在 G1 中出现过（或者在 G2 的前序遍历中加过）。如果不存在，就加入结果图并更新 INLINECODE1f91ab10；如果存在，就跳过。

#### 2.2 求交集的思路

交集的逻辑稍有不同，我们需要更严格的筛选：

预标记：首先遍历 G1 的所有边，把它们全部放入 map 中，标记为“待匹配”。
查找与匹配：接着遍历 G2 的所有边。对于 G2 中的每一条边，我们去 INLINECODE115eefc5 里查找。如果这条边也存在于 INLINECODEb821bdee 中（即之前在 G1 里出现过），说明它是交集的一部分。我们把它加入结果图。

技术提示： 在处理无向图时，判断边是否相等是一个常见的坑。例如，边 INLINECODEa9f577ff 和 INLINECODE090130d8 实际上是同一条边。我们在存储时，为了保证一致性，通常会在 map 中统一存储为一种顺序（例如节点小的在前），或者在查询时同时检查两种顺序。

3. 代码实现与详细解析

为了让你能够直接运行并理解，我们使用 C++ 来实现上述逻辑。这里我们使用元组 tuple 来表示边，包含“边的名称”、“起点”和“终点”。

#### 3.1 完整的 C++ 实现

这段代码包含了并集和交集的完整逻辑，并配有详细的中文注释。

// C++ program to find Union and Intersection of two graphs
#include 
using namespace std;

// 辅助函数：规范化边的表示，用于无向图的比较
// 我们将边的两个节点排序，确保 (u, v) 和 (v, u) 被视为相同的 key
pair getCanonicalEdge(int u, int v) {
    if (u <= v) return {u, v};
    else return {v, u};
}

// 函数：查找两个图的并集 (Union)
void find_union(
    vector<tuple > G1,
    vector<tuple > G2)
{
    // Step 1: 初始化映射来存储已添加的边
    // Key: 规范化后的边对 {u, v}, Value: 边的名称
    map<pair, string> added;
    
    // 存储并集结果的图 G
    vector<tuple > G;

    // Step 2: 遍历第一个图 G1 的边
    for (auto p : G1) {
        string edgeName = get(p);
        int u = get(p);
        int v = get(p);

        // 获取规范化的边作为 Key
        pair key = getCanonicalEdge(u, v);

        // 将 G1 的所有边直接加入结果集
        G.push_back(make_tuple(edgeName, u, v));
        // 在 map 中标记该边已被添加
        added[key] = edgeName;
    }

    // Step 3: 遍历第二个图 G2 的边
    for (auto p : G2) {
        string edgeName = get(p);
        int u = get(p);
        int v = get(p);

        pair key = getCanonicalEdge(u, v);

        // 如果该边尚未在 map 中（即 G1 中不存在）
        if (added.find(key) == added.end()) {
            // 加入结果集
            G.push_back(make_tuple(edgeName, u, v));
            // 标记为已添加
            added[key] = edgeName;
        }
    }

    // Step 4: 打印并集结果
    cout << "G1 union G2 is" << endl;
    for (auto p : G) {
        string a = get(p);
        int b = get(p);
        int c = get(p);
        cout << a << " " << b << " " << c << endl;
    }
    cout << endl;
}

// 函数：查找两个图的交集
void find_intersection(
    vector<tuple > G1,
    vector<tuple > G2)
{
    // Step 1: 初始化映射存储 G1 的边
    map<pair, string> added;
    
    // 存储交集结果的图 G
    vector<tuple > G;

    // Step 2: 遍历 G1，在 map 中标记所有边
    for (auto p : G1) {
        string edgeName = get(p);
        int u = get(p);
        int v = get(p);

        pair key = getCanonicalEdge(u, v);
        added[key] = edgeName;
    }

    // Step 3: 遍历 G2，查找在 G1 中也存在的边
    for (auto p : G2) {
        string edgeName = get(p);
        int u = get(p);
        int v = get(p);

        pair key = getCanonicalEdge(u, v);

        // 如果该边存在于 map 中（即 G1 中存在）
        if (added.find(key) != added.end()) {
            // 这是交集的一部分，加入结果集
            G.push_back(make_tuple(edgeName, u, v));
        }
    }

    // Step 4: 打印交集结果
    cout << "G1 intersection G2 is" << endl;
    for (auto p : G) {
        string a = get(p);
        int b = get(p);
        int c = get(p);
        cout << a << " " << b << " " << c << endl;
    }
    cout << endl;
}

// Driver Code
int main()
{
    // 定义图 G1
    vector<tuple > G1
        = { make_tuple("e1", 1, 2),
            make_tuple("e2", 1, 3),
            make_tuple("e3", 3, 4),
            make_tuple("e4", 2, 4) };

    // 定义图 G2
    vector<tuple > G2
        = { make_tuple("e4", 2, 4),
            make_tuple("e5", 2, 5),
            make_tuple("e6", 4, 5) };

    // 函数调用
    find_union(G1, G2);
    find_intersection(G1, G2);

    return 0;
}

4. 复杂度分析与性能优化

作为经验丰富的开发者，我们不仅要关心代码能不能跑通，还要关心它跑得快不快，占用的内存多不多。

#### 时间复杂度

并集：我们需要遍历 G1 的所有边（假设为 E1）和 G2 的所有边（假设为 E2）。在遍历过程中，我们对每条边都执行 Map 的插入和查找操作。Map 的操作平均时间复杂度是 O(log E)（如果是红黑树实现）或 O(1)（如果是哈希表实现）。因此，总的时间复杂度大约是 O(E1 log E1 + E2 log E2) 或者更优的线性时间。由于图的边的数量通常远小于节点数的平方，这个效率是非常高的。
交集：同样的逻辑，遍历两个图并在 Map 中查找。复杂度与并集相同。

#### 空间复杂度

我们需要额外的空间来存储结果图 G 以及 Map 映射。在最坏的情况下（比如并集操作，且两个图没有重边），空间复杂度是 O(E1 + E2)。

#### 优化建议

哈希表 vs. 红黑树：在上面的 C++ 代码中，我们使用了 INLINECODEe7fa7561。如果你确定边的数量非常大，且不需要有序遍历，使用 INLINECODE53fcbefa 会让查找速度从 O(log n) 提升到 O(1)，这在处理百万级边的图时差异非常明显。
边的数据结构：如果节点 ID 是连续的小整数，我们可以用邻接矩阵来表示图。这时，判断交集就变成了判断两个矩阵对应位置的值是否都大于0，这会非常快，但空间消耗较大。Map 适合稀疏图。

5. 实际应用场景与常见陷阱

理解了基本算法后，让我们看看它在实际工作中有什么用，以及要注意什么。

#### 实际应用场景

社交网络分析：假设你有来自两个不同平台的用户关系图。并集操作可以帮你合并这两个网络，找到一个“超级关系图”。交集操作则可以帮你找出在两个平台都有联系的用户对，这通常是强关系。
数据库差异同步：在分布式数据库中，不同节点的数据图谱可能不一致。通过计算图的差异（并集减去交集，即对称差），我们可以快速定位需要同步的数据。

#### 常见陷阱与解决方案

自环边：如果图中存在从节点指向自己的边 (u, u)，我们的 INLINECODEe5abdfaf 函数依然能正确处理，因为排序后它还是 (u, u)。但如果你手动写判断逻辑 INLINECODEaa42c1b3 要小心。
平行边：如果输入数据本身在同一个图内就有多条重边（比如图 G1 里有两个 "e1" 都是连接 1-2），上面的算法会把它们都视为独立的边保留下来（因为我们的 map value 存的是名字，且并集逻辑是直接 push G1）。如果你希望结果是一个简单图（没有平行边），需要在处理 G1 时也做一次去重检查。

6. 总结

在这篇文章中，我们系统地学习了如何计算两个图的并集和交集。我们从基本概念出发，通过可视化的例子理解了输入输出，随后设计了基于 Map 的高效算法，并给出了完整的 C++ 代码实现。最后，我们还讨论了性能优化和实际应用中的注意事项。

掌握这些基础图论操作，将为你处理更复杂的网络算法打下坚实的基础。希望你在下次遇到图处理问题时，能够自信地运用这些技巧！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客