深入解析 json.dump() 与 json.dumps()：Python 开发者必须掌握的 JSON 处理技能

2026-02-05 03:30:45 0条评论 3次阅读 0人点赞

作为 Python 开发者，我们在日常工作中经常需要处理数据交换和存储。在这个过程中，JSON（JavaScript Object Notation）因其轻量级、易读且跨平台的特点，成为了事实上的标准格式。当我们需要在 Python 对象和 JSON 格式之间进行转换时，内置的 json 模块是我们手中最强大的工具。

然而，许多初学者——甚至是有经验的开发者在面试或编码时——经常会混淆两个名字极其相似的函数：INLINECODE016b4a2f 和 INLINECODEf60e2820。虽然它们的核心功能都是将 Python 对象“序列化”为 JSON 格式，但它们的应用场景和操作方式有着本质的区别。

在这篇文章中，我们将深入探讨这两个方法的差异，不仅从语法层面，更从实际应用和性能优化的角度，通过丰富的代码示例，帮你彻底理清这两个概念。让我们开始吧！

1 1. 核心概念：序列化与“s”的秘密
2 2. 深入解析 json.dumps()：内存中的字符串转换
3 3. 深入解析 json.dump()：直接写入文件
4 4. 核心差异对比表
5 5. 常见陷阱与解决方案
6 6. 性能优化与最佳实践
7 7. 总结与下一步

1. 核心概念：序列化与“s”的秘密

在深入细节之前，我们需要先理解一个核心概念：序列化（Serialization）。简单来说，序列化是将内存中的数据结构（如 Python 的字典、列表）转换为可以存储或传输的格式（如 JSON 字符串或文件）的过程。

json 模块提供的这两个方法，其命名遵循了 Python 的惯例：

json.dump(): 用于将数据直接写入类文件对象，通常是一个物理文件。
json.dumps(): 这里的 ‘s‘ 代表 string。它用于将数据转换为字符串，并保存在内存中。

为了让你在实际开发中能够一眼识别该用哪个，请记住这个简单的口诀：“如果需要存文件，用 dump；如果只是转字符串，用 dumps。”

2. 深入解析 json.dumps()：内存中的字符串转换

json.dumps() 是我们在处理 API 响应、日志记录或需要进行字符串操作时的首选方法。它接收一个 Python 对象，并返回其 JSON 字符串表示。

2.1 基础语法与参数详解

虽然最常用的写法是 json.dumps(obj)，但为了生成符合特定需求的 JSON（例如美化输出或处理特殊字符），我们需要了解更完整的参数列表：

import json

# 这是一个复杂的字典对象，用于演示参数效果
student_profile = {
    "id": 101,
    "name": "张三",
    "grades": [85, 90, 78],
    "is_active": True,
    "metadata": None
}

# 1. 最基本的转换：紧凑格式
json_str = json.dumps(student_profile)
print("--- 基本转换 ---")
print(json_str) 
# 输出：{"id": 101, "name": "\u5f20\u4e09", "grades": [85, 90, 78], "is_active": true, "metadata": null}

# 2. 美化输出：使用 indent
# indent 参数定义了缩进的空格数，使输出具有层级结构，便于人类阅读
json_pretty = json.dumps(student_profile, indent=4)
print("
--- 美化输出 ---")
print(json_pretty)

# 3. 处理中文字符：使用 ensure_ascii=False
# 默认情况下，Python 会将非 ASCII 字符转义。为了可读性，我们通常关闭它
json_readable = json.dumps(student_profile, indent=4, ensure_ascii=False)
print("
--- 可读的中文 ---")
print(json_readable)

# 4. 键排序：使用 sort_keys
# 在某些测试场景或需要稳定输出的场景下，按键排序非常有用
json_sorted = json.dumps(student_profile, indent=4, sort_keys=True, ensure_ascii=False)
print("
--- 键值排序 ---")
print(json_sorted)

2.2 数据类型映射表

在使用 INLINECODEa9ed3ba6 时，理解 Python 类型与 JSON 类型的对应关系至关重要，特别是当你的数据中包含特殊值如 INLINECODE21d74efa 或布尔值时：

Python 对象

JSON 等效类型

说明 :—

:—

:— dict

object

键必须是字符串 list, tuple

array

tuple 会被转换为数组 str

string

必须是有效的 UTF-8 int, float

number

支持 IEEE 754 浮点数 True / False

true / false

注意 JSON 是小写的 None

null

空值变为 null

2.3 实战应用：API 数据预处理

在实际的 Web 开发中，我们经常需要构造发送给外部 API 的 JSON 负载。

import json

def prepare_api_payload(user_id, items):
    """准备发送给购物车 API 的数据负载"""
    payload = {
        "user_id": user_id,
        "timestamp": "2023-10-27T10:00:00Z",
        "items": items,
        "is_guest": False
    }
    # 使用 dumps 将字典转换为字符串，以便通过 HTTP 请求发送
    # ensure_ascii=False 确保 API 日志能正确显示中文商品名
    return json.dumps(payload, ensure_ascii=False)

# 模拟场景
shopping_items = [{"product": "机械键盘", "qty": 1}, {"product": "鼠标", "qty": 2}]
json_string = prepare_api_payload("u12345", shopping_items)

# 检查类型
print(f"返回的数据类型: {type(json_string)}")
print(f"准备发送的数据:
{json_string}")

3. 深入解析 json.dump()：直接写入文件

当你处理大型数据集，或者需要将配置保存下来以便下次读取时，json.dump() 是更高效的选择。它直接将数据序列化并写入文件流，避免了在内存中先创建巨大的字符串，这在处理大数据时能节省不少内存。

3.1 语法与工作原理

INLINECODE718955da 的第一个参数是 Python 对象，第二个参数必须是一个文件类对象，即拥有 INLINECODE703fbfd4 方法的对象。

import json

# 数据准备
config_data = {
    "database": {
        "host": "localhost",
        "port": 5432,
        "username": "admin",
        "password": "secret"  # 注意：实际生产中不要明文存储密码
    },
    "features": ["caching", "logging", "debug_mode"]
}

# 使用 with 语句打开文件，确保文件操作完成后正确关闭
# ‘w‘ 模式表示写入，如果文件不存在则创建，存在则覆盖
try:
    with open(‘config.json‘, ‘w‘, encoding=‘utf-8‘) as f:
        # indent=4 让配置文件更易读
        json.dump(config_data, f, indent=4, ensure_ascii=False)
    print("配置文件已成功保存为 config.json")
except IOError as e:
    print(f"文件写入失败: {e}")

3.2 上下文管理器的重要性

你可能会看到老式的代码这样写：

# 不推荐的做法
f = open("data.json", "w")
json.dump(data, f)
f.close() # 如果这行之前报错，文件可能无法正确关闭

我们强烈建议始终使用 with 语句（上下文管理器）。它不仅代码更简洁，而且能确保即使在写入过程中发生异常，文件也能被正确关闭和刷新。这是 Python 最佳实践的一部分。

3.3 进阶示例：数据流的分块处理

虽然 JSON 通常是一次性写入，但 dump 的灵活性允许我们处理文件流。假设我们正在记录日志，我们可能希望每次操作都追加 JSON 对象（注：标准 JSON 文件通常是一个大对象或对象列表，这里演示列表追加模式的思路）：

import json
import os

log_file = "activity_logs.json"

# 初始化一个空列表作为起始内容
if not os.path.exists(log_file):
    with open(log_file, "w") as f:
        json.dump([], f)

def append_log(message):
    # 这是一个演示概念，实际高并发下不推荐这样直接读写同一文件
    # 1. 读取现有数据
    with open(log_file, "r") as f:
        logs = json.load(f)
    
    # 2. 添加新数据
    logs.append({
        "timestamp": "now",
        "message": message
    })
    
    # 3. 写回文件
    with open(log_file, "w") as f:
        json.dump(logs, f, indent=2)

# append_log("用户登录")
# 实际运行中请注释掉，以免生成多余文件

4. 核心差异对比表

为了让你在面试或快速查阅时能一目了然，我们将这两个方法的关键差异整理如下：

特性

json.dump()

json.dumps() :—

:—

:— 主要用途

将序列化后的 JSON 数据直接写入文件。

将 Python 对象转换为 JSON 格式的字符串。 操作目标

文件指针。

内存对象。 返回值

返回 INLINECODE6a098c9d（它直接操作文件流）。

返回一个 INLINECODE2a5714c0 对象（JSON 字符串）。 内存占用

更低（流式写入，不需要在内存中保留完整的格式化字符串）。

较高（需要在内存中构建完整的字符串）。 典型场景

保存配置文件、日志记录、数据持久化。

API 请求体构建、打印调试、网络传输前的数据准备。

5. 常见陷阱与解决方案

在使用这两个函数时，我们（开发者）经常遇到一些棘手的问题。让我们看看如何应对。

5.1 编码问题：中文乱码

问题：你会发现生成的 JSON 文件里，INLINECODE0f1bd7c6 变成了 INLINECODEf9f8e8cf。
原因：默认情况下，ensure_ascii=True。为了保证 ASCII 兼容性，Python 会转义所有非 ASCII 字符。
解决：显式设置 ensure_ascii=False。

# 错误示范（虽然技术上正确，但难以阅读）
print(json.dumps({"name": "张三"}))

# 正确示范（适合人类阅读或中文环境）
print(json.dumps({"name": "张三"}, ensure_ascii=False))

5.2 数据类型不支持错误

问题：遇到 TypeError: Object of type datetime is not JSON serializable。
原因：JSON 标准只支持有限的数据类型（str, int, float, bool, list, dict, None）。Python 特有的类型如 INLINECODE973b4ee7, INLINECODE887bcbef, 或自定义类的实例无法直接序列化。
解决：使用 default 参数指定一个转换函数。

import json
from datetime import datetime

def str_converter(o):
    if isinstance(o, datetime):
        return o.__str__()  # 或者 o.isoformat()
    
data = {
    "event": "Login",
    "timestamp": datetime.now()
}

# 直接调用会报错
# json.dumps(data) 

# 使用自定义转换器
json_str = json.dumps(data, default=str_converter)
print(json_str) 
# 输出类似: {"event": "Login", "timestamp": "2023-10-27 10:00:00.123456"}

6. 性能优化与最佳实践

作为追求卓越的开发者，我们不仅要写出能运行的代码，还要写出高效的代码。

6.1 如何选择使用哪一个？

如果只是数据传输（例如发给前端、写入 Redis、发送 HTTP 请求）：请使用 json.dumps()。你不需要创建中间文件，直接操作字符串即可。
如果是为了持久化存储（例如保存爬虫结果、用户配置）：请使用 INLINECODEc3554208。结合 INLINECODE3298ffdd 使用，既安全又简洁。

6.2 大文件处理策略

当你需要处理 GB 级别的 JSON 数据时，一次性 INLINECODEa2cbe8b5 或 INLINECODEad57300c 可能会撑爆内存。这种情况下，建议使用 INLINECODEd6d8e7b1 等第三方库进行流式解析和生成，而不是标准库的 INLINECODE203815fb 模块。但对于大多数日常应用，标准库已经足够高效。

6.3 紧凑存储 vs 美化存储

调试阶段：使用 indent=4，让文件可读。
生产环境：不要使用 indent，也不要使用多余的空格。缩进和换行符会增加不必要的文件大小和网络传输开销。保持 JSON 为紧凑的单行格式是性能优化的一个小细节。

7. 总结与下一步

在这篇文章中，我们详细探讨了 Python INLINECODEfb3c6c36 模块中两个最基础也最重要的方法。希望通过丰富的对比和实战代码，你不再会对 INLINECODE86040eaa 和 json.dumps() 感到困惑。

让我们快速回顾一下重点：

结尾的 ‘s‘ 代表 String：这是区分它们的最快方法。INLINECODE93eb6c68 用于生成字符串，INLINECODEcec6b00e 用于写入文件。
文件操作要小心：始终使用 with open(...) 来处理文件句柄，确保资源释放。
中文处理：记得加上 ensure_ascii=False，让你的日志和配置文件更友好。
自定义序列化：当遇到复杂对象时，利用 default 参数来优雅地解决问题。

为了巩固今天的学习，建议你尝试编写一个小脚本：

创建一个包含你个人信息的 Python 字典。
使用 json.dumps() 将其格式化为漂亮的字符串并在控制台打印。
接着，使用 INLINECODE375d4bec 将这段信息保存到名为 INLINECODE66f84b1d 的文件中。
尝试修改文件内容，并用 json.load() 将其读取回来（这是这两个方法的逆操作，同样重要）。

Python 的 json 模块虽然简单，但它是连接 Python 数据世界与外部世界的桥梁。掌握好这些细节，将让你的代码更加健壮和专业。祝你编码愉快！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客