深入理解 Django ORM：精通 select_related 与 prefetch_related 的性能优化之道

2026-02-12 10:28:10 0条评论 73次阅读 0人点赞

在日常的 Web 开发工作中，我们经常需要与数据库打交道。Django 作为一个功能强大的 Python Web 框架，其 ORM（对象关系映射）系统让我们能够用面向对象的方式轻松操作数据库。然而，这种便利性有时会掩盖底层的 SQL 执行细节，如果不加以注意，很容易掉入所谓的“N+1 查询问题”陷阱。你是否遇到过这样的情况：页面加载缓慢，后台日志却显示数据库在疯狂执行查询？这正是我们需要深入探讨的话题。

在这篇文章中，我们将深入探索 Django 提供的两个强大武器：INLINECODE55142987 和 INLINECODEd36de304。我们将通过实际的代码示例，剖析它们的工作原理，了解它们之间的区别，并最终掌握如何在实际项目中通过正确的选择来显著提升查询性能。让我们一起踏上这场优化之旅吧。

1 什么是 N+1 查询问题？
2 select_related()：通过 SQL JOIN 强力联合
3 prefetch_related()：Python 层面的智能拼接
4 核心区别与选择策略
5 常见错误与性能陷阱
6 最佳实践与后续步骤

什么是 N+1 查询问题？

在深入解决方案之前，我们需要先理解问题本身。Django 的 ORM 默认采用“延迟加载”策略。这意味着，当你查询一个模型对象时，Django 只会获取该对象本身的数据，而不会立即去获取它关联的对象数据。这在很多场景下是高效的，但当我们需要遍历一组对象并访问其关联字段时，问题就出现了。

想象一下，我们有一个“省份”模型和一个“城市”模型，每个城市都属于一个省份。如果我们想要打印所有城市及其对应的省份名称，直接的做法可能是这样的：

# 假设模型定义如下
class Province(models.Model):
    name = models.CharField(max_length=100)

class City(models.Model):
    name = models.CharField(max_length=100)
    # 外键关联到省份
    province = models.ForeignKey(Province, on_delete=models.CASCADE)

# 不优化的查询代码
cities = City.objects.all()  # 第 1 次查询：获取所有城市
for city in cities:
    # 每次访问 city.province 时，Django 都会再次查询数据库
    print(f"{city.name} - {city.province.name}")

如果你有 100 个城市，这段代码实际上会执行 1（获取城市列表）+ 100（获取每个城市的省份）= 101 次数据库查询！这就是著名的“N+1 问题”。在数据量较小时，这可能不明显，但随着用户增长，这将成为系统的性能瓶颈。

select_related()：通过 SQL JOIN 强力联合

为了解决一对多（或一对一）关系中的 N+1 问题，Django 为我们提供了 INLINECODE3aabb26c。这个方法的核心思想非常直接：它利用 SQL 的 INLINECODE7457bb60 机制，在数据库层面一次性将关联表的数据拉取回来。

工作原理

INLINECODE3760dc2a 会生成一个 SQL INLINECODE2157f268（或 INLINECODE09e955e3）语句。这意味着数据库会在返回结果之前，先把 City 表和 Province 表拼在一起，Python 只需要接收这一张大表的数据即可。这种方式对于 INLINECODEb17581dd 和 OneToOneField 关系最为有效，因为它处理的是“单值”关系（即一个城市只有一个省份）。

让我们看看代码

我们将上面的例子稍作修改，只需添加一行代码，就能将 101 次查询减少到仅 1 次：

# 使用 select_related 进行优化
# 这里我们告诉 Django："在查 City 的时候，顺便把 Province 也查出来"
cities = City.objects.select_related(‘province‘).all()

for city in cities:
    # 此时访问 city.province，Django 不需要再查询数据库，
    # 因为数据已经在内存中了！
    print(f"{city.name} - {city.province.name}")

生成的 SQL 语句大致如下：

SELECT city.*, province.* 
FROM city 
INNER JOIN province ON city.province_id = province.id;

跨越多层关系

INLINECODE62d8bc20 的强大之处还在于它可以跨越多重关系。假设城市下面还有一个“市长”属于“人”表，而“人”表又有“详细信息”表，我们可以使用双下划线 INLINECODE2e4ba41a 来链式查询：

# 链式查询：City -> Province -> Country (假设 Province 有 Country 外键)
# 这会生成一个包含三个表 JOIN 的复杂 SQL 语句
complex_query = City.objects.select_related(‘province__country‘)

for city in complex_query:
    # 这里访问 city.province.country 也不会触发额外的查询
    print(f"{city.name} 位于 {city.province.country.name}")

实用见解： 虽然链式查询很方便，但请谨慎使用过长的 JOIN 链。大量的 JOIN 会导致数据库需要处理更多的数据，生成的 SQL 语句也会变得庞大，反而可能降低性能。通常来说，JOIN 超过 3-4 个表时就需要权衡一下了。

prefetch_related()：Python 层面的智能拼接

INLINECODE4b26db82 虽然强大，但它有一个局限性：它只能处理单值关系（如 OneToOne 或 ForeignKey）。当你处理 INLINECODE8827bbb6（多对多）或者反向的 ForeignKey 关系（例如一个省份有多个城市）时，使用 SQL JOIN 会导致结果集中的数据行数急剧膨胀（即所谓的“笛卡尔积”问题），这会极大地消耗内存和网络带宽。

这时，我们就需要请出 prefetch_related() 了。

工作原理

与 INLINECODEceec2558 不同，INLINECODE436f0da3 不会使用 JOIN。它的策略是分步走：

第一步：查询主表（例如 Province），获取所有需要的数据。
第二步：根据第一步的结果，收集所有关联的 ID，执行第二条 SQL 语句（通常使用 WHERE id IN (...)）来获取关联表的数据。
第三步：在 Python 内存中，将第二步的结果匹配回第一步的对象中。

实战案例：查询省份及其城市

让我们看看如何优化“查询一个省份及其所有城市”的场景：

# 假设我们要查询湖北省及其下辖的所有城市

# 优化后的查询
# 这里会触发两次数据库查询，而不是 N+1 次
hubei = Province.objects.prefetch_related(‘city_set‘).get(name="Hubei Province")

for city in hubei.city_set.all():
    print(city.name)

生成的 SQL 语句（简化版）：

-- 第 1 次查询：获取省份信息
SELECT * FROM province WHERE name = ‘Hubei Province‘;

-- 第 2 次查询：获取该省份的所有城市（利用了第一次查询的 ID）
SELECT * FROM city WHERE province_id IN (1);

进阶用法：Prefetch 对象

有时候我们不仅仅是需要获取关联对象，还需要对关联对象进行过滤或排序。INLINECODEf5f3a7cf 允许我们通过 INLINECODE8cd31ff3 对象来实现更精细的控制。

例如，我们只想获取湖北省人口超过 100 万的城市，并按名称排序：

from django.db.models import Prefetch

# 定义子查询的逻辑
large_cities_qs = City.objects.filter(population__gt=1000000).order_by(‘name‘)

# 使用 Prefetch 对象进行预取
provinces = Province.objects.prefetch_related(
    Prefetch(‘city_set‘, queryset=large_cities_qs, to_attr=‘large_cities‘)
)

my_province = provinces.first()

# 注意：我们使用了 to_attr，现在可以直接通过属性访问，
# 而不需要调用 .all()，而且这里只包含过滤后的结果
for city in my_province.large_cities:
    print(f"大城市: {city.name}")

这种写法不仅解决了性能问题，还让代码的业务逻辑更加清晰。

核心区别与选择策略

经过上面的讲解，我们可以总结出这两种方法的核心区别。为了让你在开发中能够迅速做出决定，我们整理了以下的对比策略。

关系类型

推荐方法

原因

SQL 机制

:—

ForeignKey (正向)

INLINECODEce2fe808

单一关联对象，JOIN 查询开销小。
INNER JOIN / LEFT JOIN
OneToOneField

INLINECODEae9f719c

一对一本质上是同一条记录的延伸。

INNER JOIN / LEFT JOIN

ManyToManyField

INLINECODE55830f0c

多对多会导致行数倍增，分步查询更高效。
两次独立查询 + IN 子句
反向 ForeignKey

INLINECODE0bc2733e

“一”对“多”会导致重复数据，分步查询更好。

两次独立查询 + IN 子句### 结合使用

在一个复杂的查询中，我们经常需要同时使用这两种方法。Django 允许我们链式调用它们。例如，我们要查询一本书，我们需要它的作者（INLINECODE99122095），同时也需要这本书的所有标签（INLINECODEba890225）：

# 链式调用：同时优化外键和多对多关系
books = Book.objects.select_related(‘author‘).prefetch_related(‘tags‘)

for book in books:
    print(f"书名: {book.title}, 作者: {book.author.name}") # 这里用了 select_related
    for tag in book.tags.all(): # 这里用了 prefetch_related
        print(f"标签: {tag.name}")

常见错误与性能陷阱

在实际开发中，即使是经验丰富的开发者也可能犯错。让我们看看几个常见的“坑”：

过滤了预取字段：

这是最容易犯错的地方。如果你使用了 INLINECODE76e9cf4a，然后在循环中对关联对象进行了进一步的 INLINECODE8bdcbf9f 或 order_by()，Django 将无法利用预取的数据，从而触发新的数据库查询！

    # 错误示范
    provinces = Province.objects.prefetch_related(‘city_set‘)
    for province in provinces:
        # 这行代码会再次查询数据库，因为它需要重新过滤！
        small_cities = province.city_set.filter(population__lt=500000)

解决方案：正如前文提到的，使用 Prefetch 对象在查询时就定义好过滤条件。

过度使用 select_related：

如果你在一个查询中链式 select_related 了 5-6 个表，生成的 SQL 语句会非常复杂且巨大。数据库优化器可能无法有效执行这个查询，导致查询速度反而变慢。

解决方案：分析需求，如果不需要某个表的数据，就不要加进去。或者考虑将某些 JOIN 改为 prefetch_related。

忽略计数查询：

当你需要统计关联对象的数量时（例如“每个省份有多少个城市”），不要使用 len(province.city_set.all())，这会把所有城市对象加载到内存中。

解决方案：Django 允许在预取时进行计数优化，或者直接在循环中使用 Count 聚合函数。

最佳实践与后续步骤

我们已经掌握了 Django ORM 性能优化的核心工具。为了确保我们的应用始终保持高效，以下是几条最佳实践建议：

开启 Django Debug Toolbar：这几乎是 Django 开发的必备工具。它能直观地展示每个页面触发了多少次 SQL 查询，以及每次查询的执行时间。看着那个红色的“Duplicates”警告，你会更有动力去优化代码。

先分析，后优化：不要盲目地给所有查询都加上 INLINECODE49a74d86 或 INLINECODE4928e5e5。对于某些只需要获取一条记录的详情页，延迟加载可能完全够用。只有在发现确实存在 N+1 问题或查询耗时过长时，才进行优化。

阅读 QuerySet 的 SQL：如果你不确定 INLINECODE75577bc2 到底做了什么，可以在代码中加上 INLINECODE7bf78af3 来打印生成的 SQL 语句。理解 ORM 背后的 SQL 是成为高阶开发者的必经之路。

关注数据库索引：ORM 的优化策略可以减少查询次数，但数据库索引的建立能加快单次查询的速度。确保 INLINECODEe8a518c4 和频繁用于 INLINECODE79650210、join 的字段上有适当的索引。

通过合理地运用 INLINECODEa1cf9c8e 和 INLINECODE5625767e，我们可以将原本可能数百次的数据库请求压缩到寥寥几次。这不仅减轻了数据库的压力，更极大地提升了用户的响应速度体验。希望这篇文章能帮助你在 Django 开发的道路上更加游刃有余！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客

深入理解 Django ORM：精通 select_related 与 prefetch_related 的性能优化之道

什么是 N+1 查询问题？

select_related()：通过 SQL JOIN 强力联合

工作原理

让我们看看代码

跨越多层关系

prefetch_related()：Python 层面的智能拼接

工作原理

实战案例：查询省份及其城市

进阶用法：Prefetch 对象

核心区别与选择策略

常见错误与性能陷阱

最佳实践与后续步骤

相关文章美国1G带宽/1T流量高速vps $17.99/年