Django ORM 实战指南：如何高效执行 GROUP BY 分组查询

2026-02-05 02:50:21 0条评论 64次阅读 0人点赞

在构建数据驱动的 Web 应用时，我们经常需要对数据库中的数据进行分类汇总。想象一下，你正在运营一个电商网站，老板让你生成一份报表，不仅要显示每个商品类别的销售额，还要统计每个类别下的商品数量。在传统的 SQL 开发中，你会毫不犹豫地写下 SELECT category, SUM(price) FROM products GROUP BY category。但是，在 Django 的优雅 ORM 体系中，我们该如何用 Python 代码实现这一逻辑呢？

这就是我们要探讨的核心问题：如何在 Django 中执行 GROUP BY 查询？

很多刚从 SQL 转向 Django 的开发者，往往会陷入试图直接执行原生 SQL 的误区。虽然 Django 允许这么做，但这并不是最“Django”的做法。Django 的 ORM 提供了一套强大且语义化的工具来处理分组和聚合，这不仅能让代码更具可读性，还能在一定程度上规避 SQL 注入风险，并保持数据库层面的抽象。

在这篇文章中，我们将不仅仅学习语法，更会深入探讨 INLINECODEdd053124、INLINECODEfd2f6c08 和 values() 这“三剑客”是如何协同工作的。我们会通过一个完整的实战项目——从零开始搭建到一个功能完备的数据统计页面——来演示这些概念。无论你是想统计平均值、求和，还是进行复杂的分组筛选，读完这篇文章，你都将掌握一套系统的解决方案。

为什么 GROUP BY 至关重要？

在实际的业务场景中，原始数据往往是琐碎的。比如，我们的数据库里可能记录了每一笔订单、每一次点击。但是，对决策者而言，原始数据的本身意义有限，他们更关心的是“聚合后的指标”。

数据聚合：将数千行数据压缩成有意义的统计结果。
分类分析：通过某个维度（如地区、时间、类别）对比不同组别的表现。

在 Django 中，实现这一点的核心在于理解 INLINECODEb5ed6b83 是如何转换为 SQL 语句的。通常，我们并不直接写 INLINECODE5e2d6df8 子句，而是通过组合使用 INLINECODE64c30e92 和 INLINECODE08813264 方法，让 ORM 自动为我们生成对应的 GROUP BY 语句。

准备工作：搭建你的实验室

为了深入理解这些概念，动手实践是最好的方式。让我们创建一个全新的 Django 项目，专门用于演示分组查询的魔力。我们将创建一个名为 INLINECODE0a2997ee 的项目和一个名为 INLINECODEdf0a79a3 的应用。

#### 步骤 1：初始化项目结构

首先，确保你的开发环境中已经安装了 Django。如果还没有，打开你的终端或命令提示符，运行以下命令进行安装：

pip install django

接下来，我们开始搭建项目骨架：

# 创建项目
django-admin startproject myproject
cd myproject

# 创建应用
python manage.py startapp myapp

创建应用后，最重要的一步是告诉 Django 这个应用的存在。打开 INLINECODE23b2bcf6 文件，找到 INLINECODEfb9e8a45 列表，将我们的 myapp 添加进去：

# myproject/settings.py

INSTALLED_APPS = [
    ‘django.contrib.admin‘,
    ‘django.contrib.auth‘,
    ‘django.contrib.contenttypes‘,
    ‘django.contrib.sessions‘,
    ‘django.contrib.messages‘,
    ‘django.contrib.staticfiles‘,
    # 添加我们自己的应用
    ‘myapp‘,
]

#### 步骤 2：构建数据模型

我们需要一个模型来模拟真实业务场景。假设我们要管理一个库存系统，其中包含不同的物品类别和它们对应的价值。在 myapp/models.py 中，我们定义如下模型：

# myapp/models.py
from django.db import models

class Item(models.Model):
    """
    物品模型：用于演示分组查询
    包含类别名称和对应的数值价值
    """
    category = models.CharField(max_length=100, help_text="物品类别")
    value = models.IntegerField(help_text="物品价值")

    def __str__(self):
        return f"{self.category} - {self.value}"

模型定义好之后，我们需要执行数据库迁移来创建真实的数据库表：

python manage.py makemigrations
python manage.py migrate

#### 步骤 3：填充测试数据

“巧妇难为无米之炊”。为了验证 GROUP BY 的效果，我们需要一些数据。虽然我们可以编写脚本来批量插入，但使用 Django 自带的 Admin 后台是最快捷的方法。

首先，创建一个管理员账户：

python manage.py createsuperuser

然后，注册我们的模型到 Admin 界面。编辑 myapp/admin.py：

# myapp/admin.py
from django.contrib import admin
from .models import Item

admin.site.register(Item)

启动开发服务器：

python manage.py runserver

访问 http://127.0.0.1:8000/admin/，登录并添加几条数据。为了看到分组的效果，请务必添加一些具有相同 category 的记录。例如：

类别 A，价值 100
类别 A，价值 200
类别 B，价值 150

核心技术：深入解析 GROUP BY 实现机制

数据就位后，让我们进入正题。在 Django 中，有两种主要的途径来实现 GROUP BY 逻辑。理解它们的区别对于写出高效的代码至关重要。

#### 方法一：使用 INLINECODE0a0cdaad 配合 INLINECODEb7d0ec80

这是最常用且符合标准 SQL 逻辑的方式。INLINECODE10b9bfef 方法指定了我们想要按照哪个字段进行分组（即 SQL 中的 INLINECODE6888c782 字段），而 INLINECODEfbb7c093 则用于定义聚合函数（如 INLINECODEf09ec6a4, INLINECODEa1c7b1e9, INLINECODE34290aa1）。

代码示例：

让我们在 myapp/views.py 中编写第一个视图，来实现“按类别统计总价值和数量”的需求。

# myapp/views.py
from django.shortcuts import render
from django.db.models import Count, Sum, Avg
from .models import Item

def grouped_items(request):
    """
    视图函数：演示如何使用 values() 和 annotate() 进行分组查询。
    """
    # 1. values(‘category‘) 对应 SQL 中的 GROUP BY category
    # 2. annotate(...) 对应 SQL 中的 SELECT COUNT(), SUM()...
    grouped_data = Item.objects.values(‘category‘).annotate(
        # 为每个组计算总价值，命名为 total_value
        total_value=Sum(‘value‘),
        # 为每个组计算条目数量，命名为 item_count
        item_count=Count(‘id‘)
    )

    # 调试小技巧：你可以打印生成的 SQL 来验证
    # print(grouped_data.query)

    # 这里我们额外计算一个全局的总和，作为对比
    # aggregate() 返回一个字典，而不是 QuerySet
    overall_stats = Item.objects.aggregate(
        global_sum=Sum(‘value‘),
        global_count=Count(‘id‘)
    )

    context = {
        ‘grouped_data‘: grouped_data,
        ‘overall_stats‘: overall_stats,
    }
    return render(request, ‘grouped_items.html‘, context)

原理解析：

当你运行 INLINECODE631d01df 时，Django 的 QuerySet 会变成一个字典的列表，就像 SQL 一样开始按 INLINECODEcbaa5093 字段对结果进行去重和分组。紧接着的 .annotate() 方法会针对每一个分组执行聚合计算。这完全等同于执行以下 SQL：

SELECT category, SUM(value) as total_value, COUNT(id) as item_count 
FROM myapp_item 
GROUP BY category;

#### 方法二：在模型层级分组（更高级的用法）

如果你只是想聚合整张表的数据（不加 INLINECODEdb8f32dd），或者你想按关联模型的字段分组，直接在 QuerySet 上调用 INLINECODEaf78898d 也是可行的。但在处理单表分组时，推荐先使用 values()。

扩展视野：更多实战代码示例

为了让你在各种场景下都能游刃有余，这里再补充几个常见的聚合查询模式。

#### 示例 1：计算平均值（AVG）

假设我们想知道每个类别的平均价值是多少。这在分析客单价时非常有用。

from django.db.models import Avg

# 获取每个类别的平均价值
category_averages = Item.objects.values(‘category‘).annotate(
    average_value=Avg(‘value‘)
)

# 结果示例：
# [{‘category‘: ‘Electronics‘, ‘average_value‘: 150}, ...]

#### 示例 2：结合过滤

你经常只想对满足特定条件的数据进行分组。例如，只统计价值大于 50 的物品。

from django.db.models import Sum

# 先过滤，再分组
expensive_items = Item.objects.filter(value__gt=50).values(‘category‘).annotate(
    sum_of_expensive=Sum(‘value‘)
)

# 对应 SQL：SELECT category, SUM(value) ... WHERE value > 50 GROUP BY category

#### 示例 3：分组后再筛选（Having 子句）

在 SQL 中，我们可以在分组后使用 INLINECODEcdb5bbe9 来过滤组。在 Django 中，我们可以在 INLINECODE3ad1ac72 之后再次调用 filter()。

场景：只显示“总价值超过 300”的类别。

from django.db.models import Sum

# 先分组聚合，再过滤聚合结果
high_value_groups = Item.objects.values(‘category‘).annotate(
    total=Sum(‘value‘)
).filter(total__gt=300)

# 注意：这里的 filter 是针对聚合结果的，相当于 HAVING total > 300

完善前端展示

后端逻辑完成后，我们需要一个模板来美化地展示这些数据。创建 myapp/templates/grouped_items.html：




    
    Django 分组查询演示
    
        body { font-family: Arial, sans-serif; max-width: 800px; margin: 20px auto; line-height: 1.6; color: #333; }
        table { width: 100%; border-collapse: collapse; margin-bottom: 20px; }
        th, td { border: 1px solid #ddd; padding: 12px; text-align: left; }
        th { background-color: #f2f2f2; }
        h1, h2 { color: #444; }
        .highlight { background-color: #e7f3fe; padding: 10px; border-left: 6px solid #2196F3; margin-bottom: 20px; }
    


    物品类别分组统计
    
    
        这是一个 Django ORM 分组查询的演示页面。数据通过 values() 和 annotate() 从数据库实时聚合生成。
    

    分组详情 (GROUP BY)
    
            {% for item in grouped_data %}
            
            {% empty %}
            
            {% endfor %}
        
        
            
                类别
                物品数量
                总价值
                平均价值
            
        
        
                {{ item.category }}
                {{ item.item_count }}
                {{ item.total_value }}
                
                {% widthratio item.total_value item.item_count 1 %}
            

                暂无数据，请先在 Admin 后台添加数据。
            
    

    全局统计 (AGGREGATE)
    
        所有物品的总价值: {{ overall_stats.global_sum }}
        所有物品的总数量: {{ overall_stats.global_count }}

类别	物品数量	总价值	平均价值
{{ item.category }}	{{ item.item_count }}	{{ item.total_value }}	{% widthratio item.total_value item.item_count 1 %}
暂无数据，请先在 Admin 后台添加数据。

配置 URL 路由

最后，我们需要将视图和 URL 连接起来。在 myapp/urls.py 中添加路径：

# myapp/urls.py
from django.urls import path
from .views import grouped_items

urlpatterns = [
    path(‘grouped/‘, grouped_items, name=‘grouped_items‘),
]

别忘了在主项目的 myproject/urls.py 中包含应用的 URL：

# myproject/urls.py
from django.contrib import admin
from django.urls import path, include

urlpatterns = [
    path(‘admin/‘, admin.site.urls),
    path(‘‘, include(‘myapp.urls‘)), # 包含应用路由
]

常见陷阱与性能优化建议

在使用 Django ORM 进行分组查询时，有几个坑是开发者容易踩到的，这里分享一些经验之谈。

1. 忘记 values() 的顺序

这是新手最容易犯的错误。如果你写成 INLINECODE1d4f06c0，Django 会先对整张表进行聚合（生成一个巨大的总和），然后尝试提取 INLINECODE5cccca14，这会导致错误或完全不同的结果，因为聚合后的 QuerySet 可能不再包含具体的 INLINECODE5a46ca12 字段用于分组。请记住：先 INLINECODEf5d5a992 (定义分组键)，再 annotate() (定义聚合值)。

2. N+1 查询问题

虽然 INLINECODE4ef9dea1 通常只生成一条 SQL 语句，但如果你在模板循环中试图访问分组对象的关联对象详情，可能会触发额外的查询。务必使用 INLINECODE1f3512ae 或 INLINECODEa6f9b4e8 来预加载数据，或者在 INLINECODE13765356 中明确列出你需要的所有字段。

3. 性能考量

GROUP BY 操作在大数据量表上可能是昂贵的。确保你的数据库表在分组字段（如 category）上有适当的索引。你可以在模型的 Meta 类中定义索引：

class Item(models.Model):
    # ... fields ...
    class Meta:
        indexes = [
            models.Index(fields=[‘category‘]),
        ]

总结与下一步

通过这篇详细的教程，我们不仅构建了一个完整的项目，更重要的是，我们掌握了 Django ORM 中实现 INLINECODE0f705b28 查询的核心逻辑：利用 INLINECODEa224789e 指定分组维度，利用 .annotate() 计算聚合指标。

我们探讨了从基础的计数、求和，到更复杂的分组后过滤，以及如何优化数据库性能。这种“用 Python 思考数据库”的方式，正是 Django 框架的魅力所在。

接下来，建议你尝试在自己的项目中替换掉原本的原生 SQL 查询，或者尝试使用 Django 的 INLINECODE88c35b16 表达式和 INLINECODE04ceabab 对象结合聚合查询，实现更复杂的数据分析功能。祝你编码愉快！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客

Django ORM 实战指南：如何高效执行 GROUP BY 分组查询

为什么 GROUP BY 至关重要？

准备工作：搭建你的实验室

核心技术：深入解析 GROUP BY 实现机制

扩展视野：更多实战代码示例

完善前端展示

物品类别分组统计

分组详情 (GROUP BY)

全局统计 (AGGREGATE)

配置 URL 路由

常见陷阱与性能优化建议

总结与下一步

相关文章美国1G带宽/1T流量高速vps $17.99/年