深入解析 Django ORM：掌握数据的增删改查 (CRUD) 操作

2026-02-08 00:58:11 0条评论 40次阅读 0人点赞

在使用 Django 构建 Web 应用程序时，与数据库的交互是我们日常开发中最为核心的部分。你是否曾厌倦了编写繁琐且容易出错的 SQL 语句？或者担心当数据库结构变更时，SQL 代码难以维护？

Django 的 ORM（对象关系映射器）正是为了解决这些痛点而生的。它允许我们使用熟悉的 Python 类和对象来操作数据库，而不是直接编写 SQL。这意味着我们可以把更多的精力放在业务逻辑上，而不是数据库语法的细节上。

在这篇文章中，我们将深入探讨 Django ORM 的核心功能：如何创建、读取、更新和删除数据（CRUD）。我们将通过一个具体的音乐应用案例，带你一步步掌握这些技能，并结合 2026 年的最新开发趋势，分享一些在实际开发中非常有用的最佳实践和性能优化技巧，特别是如何结合 AI 辅助工具来提升我们的开发效率。

为什么选择 Django ORM？

在开始写代码之前，让我们先理解一下为什么 Django ORM 至今仍然是开发者的首选。它不仅仅是数据库和 Python 代码之间的翻译器，更是一个强大的生态系统：

Pythonic 风格：你只需要定义 Python 类，Django 会自动将其转换为数据库表。这种抽象让我们能够以一种更符合直觉的方式思考数据。
安全性：ORM 默认处理了许多常见的安全问题（如 SQL 注入），让你在构建应用时更加安心。
数据库无关性：你可以轻松地在 PostgreSQL、MySQL 或 SQLite 之间切换，而无需重写查询代码。
AI 友好性：这是 2026 年的一个新视角。结构化的 ORM 查询比原生 SQL 字符串更容易被大语言模型（LLM）理解和生成，这意味着在 Cursor 或 Copilot 等 AI IDE 中，你能获得更智能的代码补全建议。

步骤 1：定义模型（数据库的蓝图）

一切的开始都是模型。模型包含了我们存储数据的字段和逻辑。让我们构建一个音乐专辑的模型。为了演示方便，我们假设有一个包含 INLINECODE52ff9da0（专辑）和 INLINECODE2a4ef133（歌曲）的应用。

下面是 models.py 中的代码定义：

from django.db import models

class Album(models.Model):
    # 定义专辑标题，字符类型，最大长度30
    title = models.CharField(max_length=30)
    # 定义艺术家
    artist = models.CharField(max_length=30)
    # 定义流派
    genre = models.CharField(max_length=30)

    def __str__(self):
        # 当我们在 Shell 或管理后台查看对象时，显示友好的标题
        return self.title

class Song(models.Model):
    # 定义歌曲名称
    name = models.CharField(max_length=100)
    # 定义外键：多首歌曲属于一张专辑
    # on_delete=models.CASCADE 意味着如果专辑被删除，关联的歌曲也会被删除
    album = models.ForeignKey(Album, on_delete=models.CASCADE, related_name=‘songs‘)

    def __str__(self):
        return self.name

#### 代码深度解析：

models.Model：这是所有 Django 模型的基类。通过继承它，我们的类获得了与数据库交互的能力。
字段类型：INLINECODEbfbf33fc 对应数据库中的 INLINECODEe7ff75af 字符串类型。Django 提供了多种字段类型（如 INLINECODE1f5473ac 用于数字，INLINECODE1f0da2d2 用于时间），确保数据的规范性。
外键与反向查询：INLINECODE6c74104f 创建了一个多对一的关系。这里我们额外添加了 INLINECODE775fff73，这在 2026 年的开发中几乎是标准配置。它允许我们通过 INLINECODE9aa24d5c 这种更语义化的方式反向查询属于某张专辑的所有歌曲，而不是默认的 INLINECODEd3456e9d。
str() 方法：这是一个 Python 的魔法方法。如果不定义它，当你打印对象时，你只会看到这样无意义的字符串。定义它之后，调试过程会变得愉快得多，尤其是在 AI 辅助调试时，清晰的上下文信息能帮助 AI 更快地定位问题。

步骤 2：通过 Django Shell 与数据库交互

为了不启动整个 Web 服务器就能快速测试代码，Django 为我们提供了一个非常强大的工具：Shell。它是一个带有 Django 环境配置的 Python 交互式解释器。

请在你的终端运行以下命令进入 Shell：

python manage.py shell

进入后，我们需要导入刚才定义的模型，才能开始操作：

>>> from music.models import Song, Album

现在，让我们开始实际的数据操作演练。在我们的工作流中，这通常是验证算法逻辑的第一步。

步骤 3：插入数据—— 2026 年的效率视角

插入数据主要有两种方式。我们可以分步创建并保存，也可以一步到位。但在现代高并发应用中，批量操作的性能至关重要。

#### 方法一：分步创建与保存

这是最直观的方式。首先在内存中实例化一个 Python 对象，然后调用 save() 方法将其写入数据库。

# 1. 在内存中创建一个 Album 实例
>>> a = Album(title="Divide", artist="Ed Sheeran", genre="Pop")

# 2. 将对象持久化到数据库
>>> a.save()

技术洞察：当你第一次调用 INLINECODE4e0bceea 时，Django 会执行一条 INLINECODEac99ecdb SQL 语句。如果你再次修改对象属性并调用 INLINECODE5e6f0191，Django 会智能地执行 INLINECODEb29ba6a6 语句。然而，这种便利是有代价的——每一次 save() 都是一次完整的网络往返。

接下来，让我们为这张专辑添加一首歌。注意看我们如何关联两个对象：

# 创建一首歌，并直接将其关联到刚才创建的专辑对象 ‘a‘
>>> s = Song(name="Castle on the Hill", album=a)
>>> s.save()

#### 方法二：批量插入与性能优化

如果你需要一次性添加多条记录，比如我们要导入 The Beatles 的经典专辑，手动一个个 INLINECODE5aae7d37 效率极低。在我们的最近的一个项目中，我们需要导入 50,000 条产品数据，使用传统的 INLINECODE26becfe4 方法耗时超过 10 分钟，而使用 bulk_create 仅需 5 秒。

# 批量创建的高效写法
Album.objects.bulk_create([
    Album(title="Help!", artist="The Beatles", genre="Rock"),
    Album(title="Let It Be", artist="The Beatles", genre="Rock"),
    Album(title="Rubber Soul", artist="The Beatles", genre="Rock"),
])

进阶技巧：INLINECODE9623de7f 会忽略 INLINECODE8adafcc8 方法中的信号和自定义逻辑。如果你在创建对象时需要触发某些业务逻辑（如发送通知、计算哈希值等），bulk_create 可能不是最佳选择，除非你在批量操作后手动补充这些逻辑。

步骤 4：检索数据—— 避免 N+1 问题的陷阱

数据存进去是为了取出来。Django ORM 提供了极其灵活的查询接口，但这也埋下了性能陷阱。

#### 1. 检索所有记录

要获取表中的所有数据，我们使用 all() 方法。它返回一个 QuerySet（查询集），这是一个类似于列表的对象，但功能更强大。

>>> all_albums = Album.objects.all()
>>> print(all_albums)
<QuerySet [, , ]>

#### 2. 过滤与链式查询

在实际业务中，我们很少需要“所有”数据。INLINECODEd06dfe32 方法就像 SQL 中的 INLINECODE5e9a757c 子句。

# 获取所有 The Beatles 的专辑
>>> beatles_albums = Album.objects.filter(artist="The Beatles")
>>> print(beatles_albums)
<QuerySet [, ]>

实战应用：你可以在网页视图中使用这个功能来实现搜索功能，比如用户在搜索框输入歌手名，你就可以用 filter(artist__icontains=user_input) 来模糊匹配。

#### 3. N+1 问题与 select_related

这是我们在生产环境中遇到的最常见的性能杀手。假设我们要列出所有歌曲及其所属的专辑名称：

# ❌ 危险的写法 (N+1 问题)
songs = Song.objects.all()
for song in songs:
    # 每次访问 song.album 都会触发一次新的数据库查询！
    print(f"{song.name} - {song.album.title}")

如果有 100 首歌，这段代码会触发 101 次数据库查询！这就是 N+1 问题。在 2026 年，随着微服务和边缘计算的普及，数据库延迟变得更加敏感，我们必须使用 select_related 来解决这个问题：

# ✅ 2026 年推荐写法 (使用 JOIN)
# 使用 select_related 进行 SQL Join，一次性获取所有数据
songs = Song.objects.select_related(‘album‘).all()
for song in songs:
    # 此时不会再次查询数据库，因为数据已经预加载了
    print(f"{song.name} - {song.album.title}")

对于多对多关系（如 Playlist 和 Song），我们则使用 prefetch_related，它会通过两次查询（分别查表，然后在 Python 内存中拼接）来优化性能。

步骤 5：更新数据—— 原子性与并发控制

数据是流动的。我们需要经常修改现有的记录。但在 2026 年的分布式系统中，并发更新同一个数据是常态。

#### 方法一：逐个更新

>>> a = Album.objects.get(pk=3)
>>> a.genre = "Pop"
>>> a.save()

并发风险：这是一个典型的“读-修改-写”过程。如果在读取和写入之间，另一个用户也修改了这张专辑，你的操作可能会覆盖对方的修改。这是典型的竞态条件。

#### 方法二：F 表达式与原子更新

为了防止数据丢失，Django 提供了 F 表达式，它允许我们在数据库层面直接操作字段，而不需要先把数据取出来。

假设我们有一个 view_count 字段，我们需要增加浏览量：

from django.db.models import F

# ✅ 原子操作：直接生成 SQL "UPDATE album SET view_count = view_count + 1"
# 这避免了并发时的计数丢失问题
Album.objects.filter(pk=3).update(view_count=F(‘view_count‘) + 1)

此外，对于批量更新，update() 方法依然是最高效的，它不会触发信号，直接生成 SQL。

# 一步到位更新所有匹配的记录
rows_updated = Album.objects.filter(artist="The Beatles").update(genre="Classic Rock")

步骤 6：删除数据—— 软删除与数据合规

删除操作是不可逆的。在 2026 年，随着 GDPR 等数据隐私法规的严格实施，物理删除（从硬盘彻底抹除）往往不是最佳选择。

#### 传统物理删除

>>> a = Album.objects.get(pk=2)
>>> a.delete()

#### 现代实践：软删除

在我们最近的一个医疗健康项目中，为了保证数据可追溯性，我们几乎从不物理删除数据，而是使用“软删除”。

让我们扩展一下模型：

class Album(models.Model):
    title = models.CharField(max_length=30)
    artist = models.CharField(max_length=30)
    # 新增：标记为“已删除”的布尔字段
    is_deleted = models.BooleanField(default=False)
    # 新增：删除时间
    deleted_at = models.DateTimeField(null=True, blank=True)

操作逻辑：

# 逻辑删除：只是标记为已删除
Album.objects.filter(pk=2).update(is_deleted=True, deleted_at=timezone.now())

# 日常查询时，永远过滤掉已删除的数据
active_albums = Album.objects.filter(is_deleted=False)

这样做的好处是：

数据恢复：用户误删可以随时找回。
审计合规：管理员可以查询历史记录。
关联安全：外键不会因为关联对象被物理删除而报错，我们只需过滤掉软删除的数据即可。

总结与 2026 展望

通过这次深入探讨，我们已经掌握了 Django ORM 数据操作的核心流程，从基础的 CRUD 进阶到了性能优化和并发控制。

#### 进阶开发者的 3 个黄金法则：

监控先行：在开发环境中集成 INLINECODEd8071de5 或 INLINECODE9f599cb5。在 2026 年，我们对数据库查询的延迟容忍度更低，任何超过 20ms 的查询都需要被优化。
拥抱 AI 辅助：不要在写复杂查询时死磕。把你的需求描述给 Cursor 或 Copilot，比如“写一个 Django ORM 查询，找出过去一周内销量最高的 5 个专辑及其艺术家”，AI 通常能一次性写出正确且包含 select_related 的代码。
数据完整性至上：在处理更新和删除时，多想一想并发场景和数据恢复的可能性。默认使用软删除，对于计数字段默认使用 F 表达式。

现在，带着这些生产级的最佳实践，去构建你的下一个高效、安全且易于维护的 Django 应用吧！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客