深入理解 PostgreSQL 中的 LATERAL 连接：实战指南与性能优化

2026-02-09 13:15:50 0条评论 57次阅读 0人点赞

在 PostgreSQL 的开发过程中，你可能会遇到这样一种场景：你需要对左表中的每一行数据，都去执行一次复杂的子查询，而这个子查询又依赖于左表中的某些列。在传统的 SQL 写法中，我们往往很难优雅地解决这个问题，通常不得不求助于性能较差的相关子查询，或者编写笨重的重复代码。

这时候，LATERAL 连接 就是我们手中的瑞士军刀。

在这篇文章中，我们将深入探讨 PostgreSQL 中这个强大但常被忽视的特性。我们将一起学习它的定义、语法，并通过几个实际的例子来看看它是如何简化复杂查询并提升性能的。我们还将对比它与普通连接和相关子查询的区别，帮助你掌握在实战中灵活运用 LATERAL 连接的技巧。

1 什么是 LATERAL 连接？
2 环境准备：构建实战数据
3 实战场景 1：计算部门内个人的薪资平均分（基础用法）
4 实战场景 2：获取每个部门薪资最高的前三名员工（进阶用法）
5 实战场景 3：构建动态的详细报告（多表关联）
6 性能对比：LATERAL vs 相关子查询
7 最佳实践与常见错误
8 总结

什么是 LATERAL 连接？

简单来说，LATERAL 关键字允许子查询引用同一层级 FROM 子句中在它之前出现的表（或者叫“前置表”）的列。

默认情况下，SQL 的子查询是独立的，它们不知道外部查询的上下文。而当我们加上 LATERAL 后，子查询就变成了“相关”的——对于主表（前置表）中的每一行数据，PostgreSQL 都会执行一次这个 LATERAL 子查询。这使得我们可以编写出动态的、依赖于当前行数据的查询逻辑，同时保持代码的整洁和高效。

为什么它如此重要？

想象一下，如果你需要为每个部门找出薪资最高的前三名员工。在旧的 SQL 逻辑中，你可能需要在应用层做循环，或者写一个极其复杂的 SQL 语句。而有了 LATERAL，我们可以非常直观地“遍历”部门，并对每个部门执行一次“取 Top 3”的操作。这不仅让代码更具可读性，而且由于优化器的介入，往往比单纯的相关子查询性能更好。

基础语法

让我们先来看看它的基本语法结构：

SELECT columns
FROM table_1
-- 这里是关键：LATERAL 关键字放在子查询之前
JOIN LATERAL (
    -- 这是一个可以引用 table_1 列的子查询
    SELECT sub_columns
    FROM table_2
    WHERE table_2.id = table_1.id -- 关键的关联条件
) AS alias ON true;

关键点解析：

table_1: 这是主表（或者说是左表），数据的主要来源。
LATERAL: 这是开启“魔法”的开关，告诉数据库这个子查询可以引用前面的表。
INLINECODE958eae3d: 这是一个动态子查询，它可以访问 INLINECODE7eb188f7 的当前行数据。
alias: 必须给 LATERAL 子查询起个名字，这样外部查询才能引用它的结果。
INLINECODE01d35ef8: 你经常会看到 LATERAL 连接使用 INLINECODEced86472。因为子查询内部已经处理了过滤逻辑（通过 WHERE 子句引用主表），所以外层的连接条件通常是“总是成立”。当然，你依然可以在这里写特定的连接条件。

环境准备：构建实战数据

为了更好地演示，让我们构建一个贴近真实场景的数据库。我们将创建两个表：INLINECODE283fa6c4（部门表）和 INLINECODE40842f44（员工表）。

步骤 1：创建表结构

首先，我们需要定义这两个表的关系。每个员工都属于一个部门。

-- 创建部门表
CREATE TABLE departments (
    id SERIAL PRIMARY KEY,
    department_name VARCHAR(50) NOT NULL
);

-- 创建员工表，包含外键约束
CREATE TABLE employees (
    id SERIAL PRIMARY KEY,
    name VARCHAR(50) NOT NULL,
    salary NUMERIC(10, 2),
    -- 关联到 departments 表
    department_id INT REFERENCES departments(id)
);

步骤 2：插入测试数据

现在，让我们插入一些包含不同薪资水平的数据，这样我们就能进行有意义的统计和分析。

-- 插入部门数据
INSERT INTO departments (department_name) VALUES
(‘Human Resources‘),
(‘Engineering‘),
(‘Sales‘),
(‘Marketing‘);

-- 插入员工数据（包含不同薪资）
INSERT INTO employees (name, salary, department_id) VALUES
(‘Alice‘, 60000, 1),
(‘Bob‘, 75000, 2),
(‘Charlie‘, 50000, 2),
(‘Diana‘, 65000, 1),
(‘Ethan‘, 70000, 3),
(‘Frank‘, 120000, 2),
(‘Grace‘, 55000, 1),
(‘Henry‘, 80000, 3);

现在，我们的数据准备好了。让我们通过几个具体的案例，来看看 LATERAL 连接是如何解决实际问题的。

实战场景 1：计算部门内个人的薪资平均分（基础用法）

假设我们要列出每位员工的名字，以及他们所在部门的平均薪资。这个需求听起来很简单，但如果不使用窗口函数或 LATERAL，你可能需要写一个比较复杂的 SQL 语句。

问题分析

我们需要遍历 INLINECODEf4ac951d 表的每一行。对于每一行（也就是每一个员工），我们需要去计算他所属部门的平均薪资。这就意味着子查询需要依赖外部查询的 INLINECODE18bb1394。

解决方案代码

SELECT 
    e.name AS employee_name,
    e.salary AS employee_salary,
    stats.avg_salary AS dept_avg_salary
FROM employees e
-- 开启 LATERAL 连接，允许子查询引用 e 表
JOIN LATERAL (
    -- 计算当前员工所在部门的平均薪资
    SELECT AVG(salary) AS avg_salary
    FROM employees
    WHERE department_id = e.department_id -- 这里引用了外部表 e
) AS stats ON true;

代码深度解析

在这个查询中：

主表 (employees e): 首先驱动查询。
LATERAL 子查询: 对于 employees 表中的每一行，数据库都会执行一次括号内的子查询。
动态关联: 注意看 INLINECODE0b640883。这就是 LATERAL 的核心所在。子查询不再是计算全公司的平均薪资，而是根据当前行的 INLINECODEafc277c8 动态地只计算该部门的平均值。
ON true: 因为所有的逻辑都在子查询内部完成了，外部连接只需要把结果保留下来即可，所以不需要额外的条件。

这个例子展示了 LATERAL 如何将逻辑封装在子查询中，使得主查询非常干净。

实战场景 2：获取每个部门薪资最高的前三名员工（进阶用法）

这是 LATERAL 连接最经典的应用场景之一。如果我们只想看每个部门薪水最高的前 N 名员工，普通的 GROUP BY 很难做到，而窗口函数虽然可以做到，但结果集处理起来可能不够直观。

需求

列出每个部门，并显示该部门薪资排名前 2 的员工信息。

解决方案代码

SELECT 
    d.department_name,
    top_earners.name,
    top_earners.salary,
    top_earners.rank
FROM departments d
-- 对每个部门执行一次“取前2名”的操作
JOIN LATERAL (
    SELECT 
        e.name, 
        e.salary, 
        RANK() OVER (PARTITION BY e.department_id ORDER BY e.salary DESC) as rank
    FROM employees e
    WHERE e.department_id = d.id -- 限定部门
    LIMIT 2 -- 只要前2名（或者2个结果）
) AS top_earners ON true
ORDER BY d.department_name, top_earners.salary DESC;

为什么这很强大？

在这里，departments 表先被遍历。对于“Engineering”部门，LATERAL 子查询只会运行一次，专门筛选出 Engineering 的人。然后对于“Sales”部门，子查询再次运行。这种“一行对多行”（One-to-Many）的展开模式，在没有 LATERAL 的情况下是非常难以实现的。

实战场景 3：构建动态的详细报告（多表关联）

有时候，我们不仅需要聚合数据，还需要将聚合结果与明细数据放在同一行展示。比如，我们需要显示部门名称、员工姓名，以及该部门的员工总人数。

解决方案代码

SELECT 
    d.department_name,
    emp_info.employee_name,
    emp_info.employee_salary,
    dept_stats.total_count
FROM departments d
-- 第一个 LATERAL：获取员工明细
JOIN LATERAL (
    SELECT name AS employee_name, salary AS employee_salary
    FROM employees
    WHERE department_id = d.id
) AS emp_info ON true
-- 第二个 LATERAL：获取部门统计信息（注意这里不需要再次扫描主表，可以复用上下文）
JOIN LATERAL (
    SELECT COUNT(*) AS total_count
    FROM employees
    WHERE department_id = d.id
) AS dept_stats ON true
ORDER BY d.department_name;

这个例子展示了我们可以链式地使用多个 LATERAL 连接，为主查询的每一行构建丰富、多维度的数据视图。

性能对比：LATERAL vs 相关子查询

你可能会问：“这听起来就像是相关子查询，有什么区别吗？”

确实，LATERAL 在某种程度上类似于相关子查询，但它提供了更大的灵活性和潜在的性能优势。

1. 可读性与结构

传统的相关子查询通常只能出现在 SELECT 列表或 WHERE 子句中。这意味着如果你想在结果中包含子查询的多列数据，你就必须重复编写子查询逻辑。

糟糕的做法（重复代码）：

SELECT 
    name, 
    (SELECT AVG(salary) FROM employees WHERE department_id = e.department_id) as avg,
    (SELECT MAX(salary) FROM employees WHERE department_id = e.department_id) as max
FROM employees e;

最佳实践（LATERAL）：

使用 LATERAL，我们在 FROM 子句中计算一次，然后在 SELECT 中随意引用它的列。

SELECT e.name, stats.avg_salary, stats.max_salary
FROM employees e
JOIN LATERAL (
    SELECT AVG(salary) avg_salary, MAX(salary) max_salary
    FROM employees WHERE department_id = e.department_id
) stats ON true;

2. 优化器友好性

PostgreSQL 的查询优化器在处理 LATERAL 连接时，往往能更好地理解执行路径。在某些情况下，特别是涉及到复杂的连接条件时，LATERAL 比嵌套在 SELECT 列表中的子查询更容易被优化成高效的执行计划（比如避免多次重复扫描同一张表）。

最佳实践与常见错误

在使用 LATERAL 连接时，有几点经验值得我们注意，以免掉进坑里。

1. 隐式交叉连接的风险

LATERAL 子查询是针对主表的每一行执行的。如果你的主表有 100 万行，LATERAL 子查询就会执行 100 万次。如果子查询本身很慢（比如没有索引），这可能会导致性能灾难。

建议: 确保 LATERAL 子查询内部有高效的索引支持，并且尽可能地在子查询内部通过 WHERE 子句减少数据量。

2. 引用顺序很重要

LATERAL 关键字只允许引用其左侧的表。你不能引用写在 LATERAL 关键字右侧的表，因为从逻辑上讲，右边的表还没有被处理。

错误示例：

-- 错误：table_2 在 lateral_table 右边，无法引用
SELECT * FROM table_1, lateral_table() lat, table_2
WHERE lat.col = table_2.col;

3. LEFT JOIN LATERAL 的妙用

如果 LATERAL 子查询没有返回任何结果（比如某个部门没有员工），普通的 INLINECODEfb662eeb 会导致该行数据被过滤掉。如果你希望保留主表的数据（即使子查询没结果），应该使用 INLINECODE746d2fc5。这时候，子查询返回的列将会是 NULL。

示例：

-- 即使部门没有员工，部门名称也会显示，员工信息为 NULL
SELECT d.department_name, e.name
FROM departments d
LEFT JOIN LATERAL (
    SELECT name FROM employees WHERE department_id = d.id LIMIT 1
) e ON true;

总结

PostgreSQL 的 LATERAL 连接 是一个极具威力的工具，它填补了简单连接和复杂过程化逻辑之间的空白。

通过这篇文章，我们了解到：

LATERAL 允许子查询引用前置表，实现了真正意义上的“行级动态子查询”。
它能显著减少代码重复，特别是在需要多列聚合数据时。
它是解决“Top-N 每组”问题的最佳方案之一，比传统的聚合分组更加灵活。
性能上，它允许优化器更智能地处理连接，但要注意避免对大表进行无索引的逐行子查询。

下次当你遇到需要为每一行数据计算复杂派生值，或者需要“遍历主表并查找特定相关记录”的场景时，不妨试试 LATERAL 连接。一旦你习惯了这种思维模式，你会发现它能让你的 SQL 代码既优雅又高效。

现在，打开你的 PostgreSQL 客户端，试着在你的数据集上应用一下这些技巧吧！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客

深入理解 PostgreSQL 中的 LATERAL 连接：实战指南与性能优化

什么是 LATERAL 连接？

为什么它如此重要？

基础语法

环境准备：构建实战数据

步骤 1：创建表结构

步骤 2：插入测试数据

实战场景 1：计算部门内个人的薪资平均分（基础用法）

问题分析

解决方案代码

代码深度解析

实战场景 2：获取每个部门薪资最高的前三名员工（进阶用法）

需求

解决方案代码

为什么这很强大？

实战场景 3：构建动态的详细报告（多表关联）

解决方案代码

性能对比：LATERAL vs 相关子查询

1. 可读性与结构

2. 优化器友好性

最佳实践与常见错误

1. 隐式交叉连接的风险

2. 引用顺序很重要

3. LEFT JOIN LATERAL 的妙用

总结

相关文章美国1G带宽/1T流量高速vps $17.99/年