深入解析：如何基于多个键对 Python 字典列表进行高效排序

2026-02-02 01:59:24 0条评论 61次阅读 0人点赞

在日常的数据处理任务中，我们经常与结构化数据打交道，而 Python 中的列表和字典正是处理这类数据的黄金搭档。你可能经常遇到这样的情况：手头有一个包含多个字典的列表，每个字典代表一条记录（比如用户信息、商品详情或交易记录），而你的任务是根据不止一个标准对这些记录进行排序。

例如，作为后端开发人员，你可能需要先按用户的“状态”排序，再按“注册时间”排序；或者作为数据分析师，你需要先按“年份”分组，再按“销售额”从高到低排列。这种基于多个键的排序需求非常普遍，掌握它将极大地提升你的代码效率。

在这篇文章中，我们将深入探讨如何使用 Python 强大的内置功能来实现这一目标。我们将从最常用的方法入手，逐步分析不同的实现策略，并讨论它们在实际场景中的优劣。准备好了吗？让我们开始吧。

场景设定

让我们先定义一个贯穿全文的示例数据。假设我们有一个包含学生信息的字典列表 INLINECODE7b5febd2。每个字典包含学生的姓名、年龄和分数。我们的目标是首先按 INLINECODE59f36902（年龄）升序排序，如果年龄相同，则按 score（分数）升序排序。

# 初始数据列表
data = [
    {‘name‘: ‘Aryan‘, ‘age‘: 25, ‘score‘: 90},
    {‘name‘: ‘Harsh‘, ‘age‘: 22, ‘score‘: 95},
    {‘name‘: ‘Kunal‘, ‘age‘: 25, ‘score‘: 85},
    {‘name‘: ‘Rohan‘, ‘age‘: 22, ‘score‘: 88}
]

# 期望的排序结果：
# 1. Harsh (age 22, score 95) -> 22岁里分高的在后？不，我们默认用升序。
# 修正：我们按 age 升序，score 升序。
# 结果预期：
# 1. Rohan (22, 88)
# 2. Harsh (22, 95)
# 3. Kunal (25, 85)
# 4. Aryan (25, 90)

—

方法一：使用 `sorted()` 函数与 Lambda 表达式

这是最直接、也是 Python 中最具“Pythonic”（地道）风格的方法之一。sorted() 函数会返回一个新的列表，保持原列表不变，这在处理不可变数据流时非常重要。

#### 核心原理

INLINECODEaa0f4b02 函数接受一个 INLINECODE67f1b5ac 参数。这个参数接受一个函数，该函数用于从每个列表元素中提取比较键。为了实现多键排序，我们需要让这个函数返回一个元组（Tuple）。

在 Python 中，元组的比较逻辑是“逐位比较”。它会先比较元组的第一个元素；如果相同，再比较第二个元素，以此类推。这正好符合我们多级排序的需求。

#### 代码实现

# 原始数据
data = [
    {‘name‘: ‘Aryan‘, ‘age‘: 25, ‘score‘: 90},
    {‘name‘: ‘Harsh‘, ‘age‘: 22, ‘score‘: 95},
    {‘name‘: ‘Kunal‘, ‘age‘: 25, ‘score‘: 85},
    {‘name‘: ‘Rohan‘, ‘age‘: 22, ‘score‘: 88}
]

# 使用 sorted() 和 lambda 进行多键排序
# key=lambda x: (x[‘age‘], x[‘score‘]) 告诉 Python：
# 先拿 ‘age‘ 做比较键，如果 age 一样，再拿 ‘score‘ 做比较键
sorted_data = sorted(data, key=lambda x: (x[‘age‘], x[‘score‘]))

# 打印结果
import json
print(json.dumps(sorted_data, indent=4))

输出：

[
    {"name": "Rohan", "age": 22, "score": 88},
    {"name": "Harsh", "age": 22, "score": 95},
    {"name": "Kunal", "age": 25, "score": 85},
    {"name": "Aryan", "age": 25, "score": 90}
]

#### 深入理解：反向排序

现实世界往往比默认的升序更复杂。如果你想按年龄升序（小的在前），但按分数降序（大的在前）排列同龄人，该如何处理呢？

我们可以利用取负操作符（仅适用于数值类型）来实现这一目标。这是一个非常实用的小技巧。

# 需求：age 升序，score 降序（高分在前）
# 技巧：对数值型键取反，可以反转该键的排序逻辑
sorted_custom = sorted(data, key=lambda x: (x[‘age‘], -x[‘score‘]))

print(json.dumps(sorted_custom, indent=4))

输出（Rohan 和 Harsh 的位置互换了）：

[
    {"name": "Harsh", "age": 22, "score": 95},
    {"name": "Rohan", "age": 22, "score": 88},
    {"name": "Aryan", "age": 25, "score": 90},
    {"name": "Kunal", "age": 25, "score": 85}
]

> 实用见解：Lambda 函数虽然简洁，但在处理极其复杂的排序逻辑时可能会显得有些冗长。如果代码需要在不同地方复用相同的排序逻辑，或者排序键非常多，将其定义为一个独立的具名函数可能会更清晰。

—

方法二：使用 `operator.itemgetter`

如果你追求代码的极致性能和可读性，INLINECODE48315db8 模块中的 INLINECODEa8285f82 是你不容错过的工具。

#### 为什么选择 itemgetter？

INLINECODE17813b02 是一个内置的高效函数，它的作用类似于 INLINECODE14dd0b58。但是，由于它是用 C 实现的，在底层处理上通常比手写的 Python lambda 函数要快一些，尤其是在处理海量数据时，这种性能差异会变得明显。此外，它还可以接受多个参数直接返回元组。

#### 代码实现

from operator import itemgetter

# 原始数据
data = [
    {‘name‘: ‘Aryan‘, ‘age‘: 25, ‘score‘: 90},
    {‘name‘: ‘Harsh‘, ‘age‘: 22, ‘score‘: 95},
    {‘name‘: ‘Kunal‘, ‘age‘: 25, ‘score‘: 85},
    {‘name‘: ‘Rohan‘, ‘age‘: 22, ‘score‘: 88}
]

# 使用 itemgetter(‘age‘, ‘score‘)
# 它的效果等同于 lambda x: (x[‘age‘], x[‘score‘])
sorted_data = sorted(data, key=itemgetter(‘age‘, ‘score‘))

print(json.dumps(sorted_data, indent=4))

输出结果与 Lambda 方法一致：

[
    {"name": "Rohan", "age": 22, "score": 88},
    {"name": "Harsh", "age": 22, "score": 95},
    {"name": "Kunal", "age": 25, "score": 85},
    {"name": "Aryan", "age": 25, "score": 90}
]

#### 最佳实践建议

在我们的日常开发中，如果你的排序键是固定的且是硬编码的，强烈推荐使用 itemgetter。它明确地表达了“获取项目”的意图，代码看起来更像是一篇散文，而不是一段充满了符号的逻辑。

# 对比一下，哪个更清晰？
# 选项 A (Lambda)
key_func = lambda x: (x[‘age‘], x[‘score‘])

# 选项 B (itemgetter)
key_func = itemgetter(‘age‘, ‘score‘)

# 大多数情况下，选项 B 更直观，且速度更快。

> 注意：INLINECODE73f5a7c2 在处理混合排序（如一个升序、一个降序）时不如 lambda 灵活，因为 INLINECODEeb4dcfcd 本身不支持直接对取出的值进行取负操作。在这种情况下，你需要退回到使用 lambda 表达式。

—

方法三：构建元组列表（“装饰-排序-去装饰”模式）

这个方法展示了排序算法底层的灵活性。虽然在实际应用中我们通常更倾向于前两种方法，但理解这种方法对于掌握 Python 数据处理的本质非常有帮助。这种模式在计算机科学中被称为“Schwartzian 变换”。

#### 工作原理

装饰：我们将字典列表转换为一个元组列表，元组的前几个元素是我们想要排序的键，最后一个元素是原始字典。
排序：Python 默认的排序会作用于元组的第一个元素，然后是第二个，依此类推。由于我们将排序键放在了元组的最前面，排序会自动按照我们的意愿进行。
去装饰：排序完成后，我们丢弃前面辅助用的键，只取回原始字典。

#### 代码实现

# 原始数据
data = [
    {‘name‘: ‘Aryan‘, ‘age‘: 25, ‘score‘: 90},
    {‘name‘: ‘Harsh‘, ‘age‘: 22, ‘score‘: 95},
    {‘name‘: ‘Kunal‘, ‘age‘: 25, ‘score‘: 85},
    {‘name‘: ‘Rohan‘, ‘age‘: 22, ‘score‘: 88}
]

# 第一步：装饰 - 创建元组列表 (age, score, 字典本身)
# 列表推导式：[(age, score, dict), ...]
decorated = [(x[‘age‘], x[‘score‘], x) for x in data]

# 第二步：排序 - Python 会自动按元组索引 0, 1 的顺序排序
# 这步不需要 key 参数，直接比较元组即可
decorated.sort()

# 第三步：去装饰 - 提取索引 2 处的原始字典
result = [item[2] for item in decorated]

print(json.dumps(result, indent=4))

输出：

[
    {"name": "Rohan", "age": 22, "score": 88},
    {"name": "Harsh", "age": 22, "score": 95},
    {"name": "Kunal", "age": 25, "score": 85},
    {"name": "Aryan", "age": 25, "score": 90}

#### 应用场景分析

你可能会问：“既然 lambda 这么简单，为什么还要用这种方法？”

这种方法的威力在于处理计算密集型的排序。假设你的排序键不是简单的字典查询，而是需要进行复杂的计算（比如通过 API 获取权重、计算字符串的哈希值等）。

Lambda 方法：在比较每个元素时，lambda 函数可能会被调用多次（取决于排序算法的比较次数）。如果你的 key 计算很慢，这会极大地拖慢速度。
元组列表方法：由于我们在“装饰”阶段只进行了一次复杂的计算（生成元组），之后的排序只涉及简单的整数或字符串比较。这在计算成本高且列表规模大时，能带来显著的性能提升。

—

实战进阶：处理缺失值与复杂逻辑

在真实的生产环境中，数据往往是不完美的。有些字典可能缺少某些键，或者某些值为 INLINECODE61e88c4e。直接使用上述方法会导致 INLINECODE3c642736 或 TypeError。让我们看看如何应对。

#### 1. 处理缺失的键

如果你的字典中某些记录可能没有 score，你需要提供默认值。

raw_data = [
    {‘name‘: ‘Aryan‘, ‘age‘: 25, ‘score‘: 90},
    {‘name‘: ‘Harsh‘, ‘age‘: 22}, # 缺少 score
    {‘name‘: ‘Kunal‘, ‘age‘: 25, ‘score‘: 85}
]

# 使用 dict.get(key, default) 方法
# 我们可以让缺失 score 的用户默认得 0 分，或者排在最后
data_sorted = sorted(raw_data, key=lambda x: (x[‘age‘], x.get(‘score‘, 0)))

print(json.dumps(data_sorted, indent=4))

#### 2. 处理混合类型的数据

有时候，同一个键可能对应不同类型的数据（例如字符串和数字混排），这在动态语言中很容易发生。Python 3 默认不允许直接比较不同类型（如 INLINECODE5a209dc7 和 INLINECODE6be48bdc）。

为了解决这个问题，我们可以自定义一个“类型标准化”的键函数。

mixed_data = [
    {‘name‘: ‘Alice‘, ‘id‘: ‘A100‘}, # id 是字符串
    {‘name‘: ‘Bob‘, ‘id‘: 5},         # id 是整数
]

# 定义一个安全的键函数，将所有值转为字符串进行比较
safe_key = lambda x: str(x.get(‘id‘, ‘‘))

print(sorted(mixed_data, key=safe_key))

性能优化与总结

我们探讨了三种主要的多键排序方法。在结束之前，让我们对它们做一个简单的性能对比和总结，帮助你在不同场景下做出选择。

#### 性能对比（参考）

sorted(key=lambda ...): 最通用，灵活度最高，适合大多数场景。性能开销在于 Python 函数调用的开销。

n* sorted(key=itemgetter(...)): 速度最快。特别是对于大型数据集，优先选择此方法。代码意图也最清晰。

元组列表法: 在需要极其昂贵的键计算时性能最好，但代码较繁琐。只有在遇到严重的性能瓶颈时才考虑使用。

#### 关键要点

元组比较：多键排序的核心在于 Python 会依次比较元组中的元素。(key1, key2) 的顺序决定了排序的优先级。
原地排序 vs 新列表：INLINECODE192af449 会修改原列表（更省内存），而 INLINECODE879e4a3d 会返回新列表（更安全）。根据你的内存策略选择。
复杂排序：对于降序和升序混合的需求，优先考虑在 lambda 中对数值取反，或者使用多轮排序（虽然多轮排序在特定算法下不稳定，但在 Python 的 Timsort 中通常是可控的，但不如单次元组键高效）。

结语

掌握基于多个键对字典列表进行排序，是每一位 Python 开发者从“初学者”迈向“熟练工”的必经之路。通过灵活运用 INLINECODE7af03ec1、INLINECODEfb743ef3 以及元组推导式，你可以优雅地处理各种复杂的数据结构挑战。

下次当你面对杂乱无章的 JSON 数据或数据库查询结果时，不要慌张。记得这些工具，它们能让你的数据瞬间变得井井有条。希望这篇文章能帮助你写出更干净、更高效的 Python 代码！

如果你在实际操作中遇到了任何问题，或者想了解更多关于数据排序的高级技巧，欢迎继续探索相关的文档和教程。

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客

深入解析：如何基于多个键对 Python 字典列表进行高效排序

场景设定

方法一：使用 `sorted()` 函数与 Lambda 表达式

方法二：使用 `operator.itemgetter`

方法三：构建元组列表（“装饰-排序-去装饰”模式）

实战进阶：处理缺失值与复杂逻辑

性能优化与总结

结语

相关文章美国1G带宽/1T流量高速vps $17.99/年

深入解析：如何基于多个键对 Python 字典列表进行高效排序

场景设定

方法一：使用 sorted() 函数与 Lambda 表达式

方法二：使用 operator.itemgetter

方法三：构建元组列表（“装饰-排序-去装饰”模式）

实战进阶：处理缺失值与复杂逻辑

性能优化与总结

结语

相关文章美国1G带宽/1T流量高速vps $17.99/年

方法一：使用 `sorted()` 函数与 Lambda 表达式

方法二：使用 `operator.itemgetter`