SQL 集合运算深度解析：掌握 INTERSECT 和 EXCEPT 子句

2026-02-08 18:25:08 0条评论 39次阅读 0人点赞

作为开发者，我们经常需要在数据库中处理复杂的数据关系。当你面对多个数据表，需要找出它们的交集、差集或者并集时，简单的 INLINECODE5ff6f2f9 子句可能显得力不从心。今天，我们将深入探讨 SQL 中两个非常强大但有时被忽视的集合运算符：INLINECODEb5ab3a35 和 EXCEPT。通过这篇文章，你将学会如何像数学家处理集合一样优雅地处理查询结果，无论是为了数据清洗、报表生成还是复杂的逻辑判断。

为了方便演示，我们假设正在管理一个简单的员工系统。在深入具体的子句之前，让我们先统一一下示例中将要使用的数据环境。这将帮助我们更好地理解后续查询的逻辑。

数据准备：我们的测试环境

假设我们有两张表。第一张表是 INLINECODE58fd275c（员工表），存储了所有员工的基本信息；第二张表是 INLINECODE7246827c（奖金表），记录了获得额外奖金的员工。

表 1：Employees (员工基本信息)

Name

Age

City

—

Suresh

Delhi

Ramesh

Pune

Kashish

Agra

Aditya

Mumbai表 2：Bonuses (获得奖金的员工)

BonusID

EmployeeID

Amount (INR) —

—

— 43

20,000 45

30,000 46

15,000

注意观察：ID 为 2 和 4 的员工没有出现在奖金表中，而奖金表中有一个 ID 为 5 的员工（可能是离职员工或数据错误），他并没有出现在员工基本信息表中。这种“错位”的数据正是我们使用集合运算的最佳演练场。

—

1 INTERSECT 子句：寻找共同点
2 EXCEPT 子句：找出差异
3 实战应用场景与最佳实践
4 总结

INTERSECT 子句：寻找共同点

首先，让我们来看看 INLINECODE51154b26。从字面上理解，它的意思是“相交”。在 SQL 中，INLINECODEf528355c 子句用于返回两个或多个查询结果集中的共有行。它就像是在寻找两个集合的重叠部分。

核心逻辑

当你需要找出“既满足条件 A，又满足条件 B”的记录时，这通常可以通过 INLINECODE19c4b21d 逻辑或 INLINECODE411199c1 来实现。但如果这两个条件来自完全不同的表，或者逻辑非常复杂，INTERSECT 会让代码的可读性大大提升。它会自动处理去重（DISTINCT），只返回两边都存在的数据。

基础语法

-- 查询 A
SELECT column1, column2 FROM table_A WHERE condition_A

INTERSECT

-- 查询 B
SELECT column1, column2 FROM table_B WHERE condition_B;

实战示例 1：谁是既有编制又有奖金的幸运儿？

我们想找出所有既存在于 INLINECODEb6987524 表中，又获得了 INLINECODEf71c69d7 的员工 ID 和姓名。

-- 查询 1：获取所有员工的 ID
SELECT ID, Name 
FROM Employees;

-- 交集运算
INTERSECT

-- 查询 2：获取所有获得奖金员工的 ID (假设我们通过 JOIN 获取名字)
SELECT e.ID, e.Name 
FROM Employees e
INNER JOIN Bonuses b ON e.ID = b.Employee_ID;

代码解析：

上半部分：我们从 Employees 表中选取了所有 ID 和姓名。这包括了 Suresh (1), Ramesh (2), Kashish (3), Aditya (4)。
下半部分：我们通过 INLINECODE294003ac 筛选出了那些在 INLINECODE975e39b8 表中有记录的员工。结果是 Suresh (1), Kashish (3) 和一个 ID 为 5 的不存在于主表的员工（因为我们 JOIN 了 Employees 表，所以这里实际只显示匹配上的，即 1 和 3）。
结果：INTERSECT 比较上下两个结果集，返回同时存在的行。

输出结果：

Name

—

Suresh

Kashish可以看到，Ramesh 和 Aditya 被排除了，因为他们不在奖金名单中。这种方法比写复杂的 WHERE EXISTS 子查询往往要直观得多。

实战示例 2：集合运算 vs 连接运算

让我们看一个稍微复杂一点的场景，模仿原始文章中关于 INLINECODEc9e042a6 和 INLINECODE3479b63d 的思路，但用更清晰的集合逻辑来展示。

假设我们想利用 INTERSECT 来模拟全外连接（Full Outer Join）中的交集部分（即内连接的结果）。

-- 左侧数据源：保留左表所有数据，匹配右表
SELECT e.ID, e.Name, b.Amount AS Bonus
FROM Employees e
LEFT JOIN Bonuses b ON e.ID = b.Employee_ID

INTERSECT

-- 右侧数据源：保留右表所有数据，匹配左表
SELECT e.ID, e.Name, b.Amount AS Bonus
FROM Employees e
RIGHT JOIN Bonuses b ON e.ID = b.Employee_ID;

工作原理：

第一个查询（LEFT JOIN）会返回所有员工，没奖金的员工 Bonus 列为 NULL。
第二个查询（RIGHT JOIN）会返回所有奖金记录，没匹配到员工的 ID 列为 NULL。
INTERSECT 只有两个查询中完全一致的行才会被保留下来。那些包含 NULL 的不匹配行（比如 Ramesh 的记录在右表中没有对应行，或者 ID 5 的记录在左表中没有对应行）都会被剔除。

输出结果：

Name

Bonus —

—

— 1

Suresh

20,000 3

Kashish

30,000

这确保了我们只获取到了在两边都有完美对应关系的数据“核心”。

—

EXCEPT 子句：找出差异

接下来是 EXCEPT。这个运算符非常有意思，它就像是程序员手中的“排除法”工具。它返回存在于第一个查询结果中，但不存在于第二个查询结果中的行。

注意：在某些数据库（如 MySQL, PostgreSQL）中，这个操作符通常写作 INLINECODE7320cdaf，但在某些旧系统或 Oracle 中有时也会用 INLINECODEbe17ce18，虽然标准 SQL 称之为 INLINECODEe2fb2e92。在本文中我们统一使用 INLINECODEaf0649d4。

核心逻辑

想象一下你在做数据对账。你有“账本 A”和“账本 B”。你想知道“哪笔钱在账本 A 里有，但在账本 B 里找不到？”这就是 EXCEPT 的典型应用场景。它执行的是集合的差集运算（A – B）。

基础语法

-- 查询 A (被减数)
SELECT column1, column2 FROM table_A

EXCEPT

-- 查询 B (减数)
SELECT column1, column2 FROM table_B;

实战示例 3：谁被落下了？（找出没有奖金的员工）

我们想找出那些在公司工作，但没有获得奖金的员工。

-- 查询 A：所有员工
SELECT ID, Name, NULL as Bonus -- 注意这里为了列对齐，补了 NULL
FROM Employees

EXCEPT

-- 查询 B：获得了奖金的员工
SELECT e.ID, e.Name, b.Amount
FROM Employees e
INNER JOIN Bonuses b ON e.ID = b.Employee_ID;

代码解析：

第一个查询选出了所有员工。为了让查询合法，我们必须保证 INLINECODEe2ecb2b7 的列数和类型匹配。因为 INLINECODE7738a059 表有金额列，所以我们在第一个查询中手动添加了一个 NULL 占位符。
第二个查询选出了有奖金的员工。
EXCEPT 会从第一个集合中“减去”所有在第二个集合中出现的行。Suresh 和 Kashish 出现在第二个集合中，所以他们被移除了。剩下的就是 Ramesh 和 Aditya。

输出结果：

Name

Bonus —

—

— 2

Ramesh

NULL 4

Aditya

NULL

实战示例 4：复杂的集合逻辑（再次使用 JOIN）

让我们再次使用 JOIN 组合来演示 INLINECODE7f8e157e 的威力。这一次，我们要找出那些仅仅存在于 INLINECODEc352f273 结果中，却不存在于 RIGHT JOIN 结果中的数据——也就是“只在左边，不在右边”的行。

-- 结果集 A：左连接结果（包含所有员工）
SELECT e.ID, e.Name, b.Amount
FROM Employees e
LEFT JOIN Bonuses b ON e.ID = b.Employee_ID

EXCEPT

-- 结果集 B：右连接结果（包含所有奖金记录）
SELECT e.ID, e.Name, b.Amount
FROM Employees e
RIGHT JOIN Bonuses b ON e.ID = b.Employee_ID;

深入剖析：

结果集 A 包含：

* 匹配行：(1, Suresh, 20000), (3, Kashish, 30000)

* 左独有行：(2, Ramesh, NULL), (4, Aditya, NULL)

结果集 B 包含：

* 匹配行：(1, Suresh, 20000), (3, Kashish, 30000)

* 右独有行：(NULL, NULL, 15000) — 注意：因为 ID 5 不匹配左表，ID 列可能显示为 NULL

运算结果：当我们从 A 中减去 B 时，那些“匹配行”（两边都有）被减掉了。剩下的就是 A 中独有的那部分。

输出结果：

Name

Amount —

—

— 2

Ramesh

NULL 4

Aditya

NULL

这个查询非常强大，它精准地定位了那些“有员工档案但没发钱”的记录，非常适合用于 HR 薪资系统的审计。

—

实战应用场景与最佳实践

在实际的项目开发中，我们不仅仅是为了写出一个能跑的查询，更要写出能高效解决业务问题的查询。以下是我在实际工作中总结的一些经验。

1. 数据清洗与迁移

当你把数据从旧系统迁移到新系统时，验证数据完整性是至关重要的一步。

场景：旧表有 100 万条数据，新表导入了 100 万条数据。怎么确认没有丢失？
做法：使用旧表 INLINECODE590e9776 新表。如果有结果返回，说明旧表里有数据在新表丢了。反之，用新表 INLINECODEc7e273dc 旧表，看是否有多余数据。

2. 用户权限管理

场景：INLINECODE1c2f2c6b 表包含所有注册用户，INLINECODEbee839f4 表包含付费会员。
需求：给所有非付费会员发送促销邮件。
查询：

    SELECT UserID FROM All_Users
    EXCEPT
    SELECT UserID FROM Premium_Members

这比写 INLINECODE59489142 或 INLINECODEf3f080ec 往往更符合人类的逻辑直觉。

3. 替代 NOT IN 的性能考虑

你可能会问，“为什么不用 NOT IN？”

这里有一个关键的性能陷阱：当 INLINECODEbba511d6 的子查询中包含 INLINECODE8eae9b16 值时，整个查询的结果往往会变成空集（因为 SQL 中 INLINECODE27b239aa 的逻辑特性）。此外，在某些数据库中，INLINECODEa5e4ce8e 的执行计划可能比复杂的 LEFT JOIN ... WHERE ... IS NULL 更高效，因为它专门针对集合差异进行了优化。

常见错误提示：使用 INLINECODE51e82355 时，必须确保两个查询的列数相同，且对应列的数据类型必须兼容。如果你试图比较一个 INLINECODE85765195 类型的 ID 和一个 VARCHAR 类型的 ID，数据库会直接报错。

4. 性能优化建议

虽然 INLINECODE4ff73f27 和 INLINECODEe91eccf1 很好用，但它们是有成本的。数据库本质上需要执行两次查询，构建两个结果集，然后对它们进行排序和哈希比较。

索引是关键：确保参与比较的列（特别是用于 JOIN 或 WHERE 的列）建立了索引。这能显著减少两个结果集的大小，从而加快集合运算的速度。
限制数据量：在进行集合运算前，尽量通过 WHERE 子句过滤掉不必要的数据。不要先查出 100 万行再求交集，而是先在各自的查询中过滤到可能只有 1 万行，再求交集。

—

总结

在这篇文章中，我们不仅仅是学习了两个 SQL 关键字，更是掌握了一种处理数据关系的思维方式。

INTERSECT 帮我们找到了“共识”，即两个集合的共有部分。
EXCEPT 帮我们找到了“差异”，即在一个集合中存在而在另一个中缺失的部分。

当你下次在代码评审中看到复杂的嵌套 NOT EXISTS 时，不妨停下来想一想：如果用集合运算的方式来表达，逻辑会不会变得更清晰？

实战建议：

试着在你现有的项目中找找看，有没有“寻找两个列表差异”或“找出共有用户”的逻辑。
尝试用 INLINECODE748b51c8 或 INLINECODE0695bf9c 重写这部分 SQL，对比一下代码的可读性和执行性能。

希望这篇文章能帮助你更自信地运用这些强大的 SQL 工具。如果你在实践中有任何疑问，欢迎随时交流探讨！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客

SQL 集合运算深度解析：掌握 INTERSECT 和 EXCEPT 子句

数据准备：我们的测试环境

INTERSECT 子句：寻找共同点

核心逻辑

基础语法

实战示例 1：谁是既有编制又有奖金的幸运儿？

实战示例 2：集合运算 vs 连接运算

EXCEPT 子句：找出差异

核心逻辑

基础语法

实战示例 3：谁被落下了？（找出没有奖金的员工）

实战示例 4：复杂的集合逻辑（再次使用 JOIN）

实战应用场景与最佳实践

1. 数据清洗与迁移

2. 用户权限管理

3. 替代 NOT IN 的性能考虑

4. 性能优化建议

总结

相关文章美国1G带宽/1T流量高速vps $17.99/年