深入实战：在 Flask 中完美实现过滤、排序与分页功能

2026-02-04 18:45:22 0条评论 57次阅读 0人点赞

在现代 Web 开发中，当后端需要向客户端返回大量数据时，直接将所有记录“倾倒”到前端不仅会造成巨大的性能瓶颈，还会导致极其糟糕的用户体验。试想一下，如果一个 API 接口一次性返回了 10,000 条电影数据，浏览器可能会卡死，用户也会在无尽的滚动中迷失方向。

作为一名专业的开发者，我们需要掌握三大核心数据呈现技术：过滤、排序和分页。在今天的这篇文章中，我们将深入探讨如何使用 Python 强大的微框架 Flask 来构建一个健壮的电影 API。我们将一步步学习如何从数据库中精准地检索数据、按特定规则排序，并以分页的形式优雅地展示给用户。

为什么选择 Flask？

在正式开始编码之前，让我们先简单聊聊工具。Flask 被称为“微框架”，这并不是因为它功能弱小，而是因为它核心保持精简，不强制依赖特定的数据库或工具库。它给予了我们极大的自由度来选择组件（如 ORM、表单验证等）。然而，这并不意味着我们需要从零开始造轮子。Flask 拥有极其丰富的扩展生态系统，我们可以通过添加扩展来赋予应用强大的功能，就像它们是内置的一样。

在本教程中，我们将结合 Flask-SQLAlchemy（一个强大的 ORM 工具）来实现我们的目标。这将使得数据库操作变得直观且高效。

项目目标概览

我们的任务是构建一个电影 API 服务器。具体来说，我们需要实现以下功能：

搜索与过滤：允许用户根据关键词（如电影名称）筛选数据。
分页展示：限制每页返回的数据量（例如每页 5 条），并提供翻页支持。
动态排序：支持根据电影的评分高低进行排序。

第一步：环境搭建与项目初始化

在编写业务逻辑之前，良好的开发环境是成功的一半。为了避免不同项目之间的依赖冲突，我们强烈建议使用虚拟环境。这就像是为你的项目建立一个隔离的“无菌室”，确保项目所需的 Python 包版本互不干扰。

首先，让我们创建项目目录并激活虚拟环境。打开你的终端，执行以下命令：

# 创建项目文件夹
mkdir Movie_API

# 进入目录
cd Movie_API

# 创建虚拟环境（确保你已安装 Python 3）
python3 -m venv venv

# 激活虚拟环境
# 在 macOS/Linux 上:
source venv/bin/activate
# (激活后，你会看到命令行前缀出现，提示你已处于虚拟环境中)

> 注意：如果你使用的是 Windows，激活命令通常是 venv\Scripts\activate。

接下来，我们需要安装必要的 Python 库。我们将使用 pip 来管理依赖：

# 安装 Flask 核心框架
pip3 install flask

# 安装 Flask-SQLAlchemy，用于数据库交互
pip3 install flask-sqlalchemy

# 安装 PostgreSQL 的数据库驱动
pip3 install psycopg2-binary

这里我们选择 PostgreSQL 作为我们的数据库，因为它功能强大且符合工业标准。psycopg2 是 Python 连接 PostgreSQL 的最佳适配器。

第二步：配置 Flask 应用与数据库连接

现在，让我们开始编写代码。在 INLINECODE85d61f6f 文件夹中创建一个名为 INLINECODEc6cb6fa2 的文件，这将是我们应用的入口。

首先，我们需要导入必要的库并初始化 Flask 应用。请务必注意，推荐使用工厂模式或至少显式地创建应用实例，这样有助于后续的测试和扩展。

# app.py

from flask import Flask, request, jsonify
from flask_sqlalchemy import SQLAlchemy

# 创建 Flask 实例
# __name__ 帮助 Flask 确定根路径，用于定位资源文件
app = Flask(__name__)

#### 配置数据库 URI

Flask 应用需要知道数据库在哪里。我们通过配置 SQLALCHEMY_DATABASE_URI 来告诉应用如何连接数据库。标准的 PostgreSQL URI 格式如下：

postgresql://username:password@localhost:5432/databasename

让我们把这个配置加入到我们的代码中。为了演示方便，我们先假设数据库已经准备就绪（下一节我们会详细讲如何创建）：

# 数据库配置
# 注意：请将 ‘myuser‘ 和 ‘password‘ 替换为你实际的数据库凭据
# ‘movie_db‘ 是我们将要创建的数据库名
app.config[‘SQLALCHEMY_DATABASE_URI‘] = ‘postgresql://myuser:password@localhost:5432/movie_db‘

# 这一行为了禁用 SQLALCHEMY 的事件追踪系统，能节省内存并提升性能
app.config[‘SQLALCHEMY_TRACK_MODIFICATIONS‘] = False

# 初始化 SQLAlchemy 实例，我们将通过它来操作数据库
db = SQLAlchemy(app)

第三步：数据库模型与建表

在 Flask-SQLAlchemy 中，我们通常使用 Python 类来定义数据库表结构，这被称为模型。让我们定义一个 INLINECODEdee9ab37 类，它将映射到数据库中的 INLINECODEf6c470a7 表。

# 定义 Movie 模型，继承自 db.Model
class Movie(db.Model):
    # 定义表名，如果不指定，Flask-SQLAlchemy 默认会使用类名的小写形式
    __tablename__ = ‘movies‘

    # 定义列：id 为主键
    id = db.Column(db.Integer, primary_key=True)
    # 定义列：name 为字符串，且不允许为空
    name = db.Column(db.String(), nullable=False)
    # 定义列：genre 为字符串，且不允许为空
    genre = db.Column(db.String(), nullable=False)
    # 定义列：rating 为整数
    rating = db.Column(db.Integer)

    # 构造函数，用于创建对象时初始化属性
    def __init__(self, name, genre, rating):
        self.name = name
        self.genre = genre
        self.rating = rating

    # 辅助方法：定义对象的输出格式（方便调试）
    def __repr__(self):
        return f""

#### 动手创建数据库

在代码写好之后，我们需要在 PostgreSQL 中真正建立这个数据库。如果你还没安装 PostgreSQL，请先去官网下载安装。

我们可以通过命令行工具 psql 来完成这一步。以下是创建数据库和用户的常用命令流程：

登录 PostgreSQL 控制台：

    sudo -u postgres -i  # 切换到 postgres 用户
    psql                # 进入命令行界面

创建数据库和用户：

在 psql 提示符下，输入以下 SQL 命令：

    CREATE DATABASE movie_db;           -- 创建数据库
    CREATE USER myuser WITH PASSWORD ‘password‘; -- 创建用户及密码
    GRANT ALL PRIVILEGES ON DATABASE movie_db TO myuser; -- 授权

执行建表操作：

回到 Python 环境，我们可以利用 Flask 的上下文来自动创建我们在代码中定义的表结构。在你的 app.py 末尾暂时添加以下代码来初始化表，或者直接在 Python 交互式 shell 中执行：

    # 仅用于初始化演示：在应用上下文中创建所有表
    # 实际生产中通常使用 Flask-Migrate 进行版本管理
    with app.app_context():
        db.create_all()
        print("数据库表创建成功！")

第四步：添加测试数据

为了方便测试排序和分页功能，我们需要在数据库中预置一些数据。让我们编写一个简单的脚本或者路由来插入几条电影记录。

你可以在 Python shell 中运行以下代码，或者直接写在 app.py 里运行一次：

# 这是一个插入数据的辅助函数示例
def add_dummy_data():
    # 检查数据库是否已经有数据，避免重复添加
    if Movie.query.count() == 0:
        new_movies = [
            Movie(name="The Shawshank Redemption", genre="Drama", rating=9),
            Movie(name="The Godfather", genre="Crime", rating=9),
            Movie(name="The Dark Knight", genre="Action", rating=8),
            Movie(name="Pulp Fiction", genre="Crime", rating=7),
            Movie(name="Forrest Gump", genre="Drama", rating=7),
            Movie(name="Inception", genre="Sci-Fi", rating=9),
            Movie(name="The Matrix", genre="Sci-Fi", rating=8),
            Movie(name="Interstellar", genre="Sci-Fi", rating=8)
        ]
        db.session.bulk_save_objects(new_movies)
        db.session.commit()
        print("测试数据插入成功！")
    else:
        print("数据已存在，跳过插入。")

# 初始化并添加数据
if __name__ == "__main__":
    with app.app_context():
        db.create_all() # 确保表存在
        add_dummy_data() # 插入数据

第五步：实现核心逻辑——过滤、排序与分页

到了最激动人心的部分了！我们将编写一个 API 端点（endpoint），它将接收 URL 参数，并根据这些参数动态查询数据库。

在 Flask 中，我们可以通过 request.args.get(‘key‘) 来获取 URL 查询字符串中的参数。

#### 完整的 API 端点实现

让我们编写 /movies 接口。这个接口将支持：

page: 页码（默认第1页）
per_page: 每页条数（默认5条）
sort: 排序字段（如 ‘rating‘）
order: 排序方式（‘asc‘ 升序, ‘desc‘ 降序）
search: 搜索关键词

@app.route(‘/movies‘, methods=[‘GET‘])
def get_movies():
    # 1. 获取参数并设置默认值
    # get() 方法的第二个参数是默认值
    page = request.args.get(‘page‘, 1, type=int)
    per_page = request.args.get(‘per_page‘, 5, type=int)
    sort_field = request.args.get(‘sort‘, ‘id‘)
    sort_order = request.args.get(‘order‘, ‘asc‘)
    search_term = request.args.get(‘search‘, ‘‘)

    # 2. 开始构建查询
    # 首先处理过滤：如果有搜索词，则在 name 字段中模糊查找
    query = Movie.query
    
    if search_term:
        # 使用 like 进行模糊匹配，% 表示任意字符
        query = query.filter(Movie.name.like(f‘%{search_term}%‘))

    # 3. 处理排序
    # 这是一个简单的验证，防止 SQL 注入，只允许特定字段排序
    valid_sort_fields = [‘id‘, ‘name‘, ‘rating‘]
    if sort_field in valid_sort_fields:
        # 获取对应的列对象，例如 Movie.rating
        sort_column = getattr(Movie, sort_field)
        
        # 根据排序方向应用 asc() 或 desc()
        if sort_order == ‘desc‘:
            query = query.order_by(sort_column.desc())
        else:
            query = query.order_by(sort_column.asc())
    else:
        # 如果传入的排序字段非法，默认按 ID 升序
        query = query.order_by(Movie.id.asc())

    # 4. 执行分页查询
    # paginate() 方法会自动计算 offset 和 limit
    # error_out=False 表示如果页码超出范围返回空列表，而不是 404 错误
    pagination = query.paginate(page=page, per_page=per_page, error_out=False)
    
    # 获取当前页的数据
    movies = pagination.items

    # 5. 格式化输出结果
    # 将 SQLAlchemy 对象转换为字典，方便序列化为 JSON
    output = []
    for movie in movies:
        movie_data = {
            ‘id‘: movie.id,
            ‘name‘: movie.name,
            ‘genre‘: movie.genre,
            ‘rating‘: movie.rating
        }
        output.append(movie_data)

    # 6. 返回 JSON 响应，包含数据部分和分页元数据
    return jsonify({
        ‘data‘: output,
        ‘meta‘: {
            ‘page‘: page,
            ‘pages‘: pagination.pages,      # 总页数
            ‘total_count‘: pagination.total, # 总记录数
            ‘per_page‘: per_page,
            ‘has_next‘: pagination.has_next, # 是否有下一页
            ‘has_prev‘: pagination.has_prev  # 是否有上一页
        }
    })

代码工作原理深度解析

让我们仔细剖析上面的代码，确保你理解每一处细节。

过滤: 我们使用了 INLINECODE8e16f1cb。这是 SQLAlchemy ORM 提供的强大功能，它将 Python 代码转换为原生 SQL 语句：INLINECODE03319231。如果不提供 search_term，这个过滤条件就会被跳过，从而返回所有记录。

排序: 这里有个小技巧。因为排序字段是动态传入的，我们不能直接写 INLINECODEf27b697f。我们需要使用 Python 内置的 INLINECODE4eb51fcd 函数来动态获取模型类中的属性。比如 INLINECODE094fc4b8 就等同于 INLINECODE5c16a54b。此外，我们还加入了一个白名单检查 (valid_sort_fields)，这是一个很好的安全习惯，防止恶意用户传入不存在的列名导致程序崩溃或发生 SQL 注入。

分页: INLINECODE4c2dbd92 是本教程的核心。它封装了复杂的 SQL INLINECODE0acfd812 和 OFFSET 逻辑。

– INLINECODEf8045ce1 相当于 INLINECODE0e2c6ed9，告诉数据库只返回这么多条数据。

– INLINECODE411746eb 相当于 INLINECODE256d915a，告诉数据库跳过前面多少条数据。

使用 ORM 的分页方法比手写 SQL 更加安全，因为它自动处理了边界情况（比如页码为负数或超出总页数）。

实际应用与测试

现在你可以启动 Flask 应用来测试你的劳动成果了：

# 在终端运行
python app.py

应用启动后，你可以打开浏览器或使用 curl / Postman 访问以下 URL 进行测试：

获取第一页数据：

http://127.0.0.1:5000/movies

预期结果：返回前 5 部电影，按 ID 默认排序。

按评分降序排序，每页 3 条：

http://127.0.0.1:5000/movies?sort=rating&order=desc&per_page=3

预期结果：返回评分最高的 3 部电影。

搜索名字包含 "The" 的电影：

http://127.0.0.1:5000/movies?search=The

预期结果：返回所有名字中包含 "The" 的电影。

组合查询：搜索、排序、翻页：

http://127.0.0.1:5000/movies?search=Sci-Fi&sort=rating&order=asc&page=1

预期结果：在科幻片中查找，并按评分从低到高排序。

常见陷阱与最佳实践

在实现过程中，有几个问题是我们经常在 StackOverflow 上看到的，这里为你总结一下避坑指南：

数据类型转换：INLINECODE1b7d6bc2 默认返回字符串。对于 INLINECODE25daf329 和 INLINECODE8890d3fe，务必添加 INLINECODEadec2c89 参数，否则在进行数据库查询时会因为类型不匹配而报错。
性能优化：如果你有百万级数据，简单的 INLINECODE23f0f609 查询（尤其是 INLINECODEad05c59f 开头）会导致数据库索引失效，进而引发全表扫描，拖慢服务器。在生产环境中，建议引入全文搜索引擎（如 Elasticsearch 或 PostgreSQL 的内置全文搜索）来处理复杂的搜索需求。
分页的深度：当用户请求页码数非常大时（例如 INLINECODEe02777d8），INLINECODE970c5456 的值也会变得非常大，数据库依然需要扫描并抛弃前面的所有数据，性能极差。这种情况下，通常采用“游标分页”，即基于上一条数据的 ID 或时间戳来获取下一页，而不是基于页码。

总结

在这篇文章中，我们从零开始，构建了一个具备工业级数据展示功能的 Flask API。我们不仅学会了如何配置数据库和定义模型，更重要的是，我们掌握了在 Web 开发中至关重要的数据处理三板斧——过滤、排序和分页。

希望这些代码示例和解释能让你对这些概念有更深刻的理解。接下来，你可以尝试扩展这个项目，比如添加用户认证、使用 Docker 容器化部署，或者接入前端框架（如 Vue 或 React）来展示这些数据。编码之路漫长而有趣，继续探索吧！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客