如何在 Python 中将 JSON 转换为 CSV：专家级指南与实战代码

2026-02-09 04:52:04 0条评论 1次阅读 0人点赞

在日常的数据处理工作中，我们经常面临需要在不同的数据格式之间进行转换的任务。无论你是正在从 API 获取数据的数据分析师，还是需要将配置文件导出为报表的后端工程师，将 JSON 转换为 CSV 都是 Python 编程中一项非常实用且必不可少的技能。

在这篇文章中，我们将深入探讨如何利用 Python 强大的标准库来处理这一转换过程。我们不仅会看到基础的代码实现，还会深入讲解背后的工作原理、常见问题的解决方案以及一些性能优化的建议。让我们开始这段探索之旅吧。

1 为什么要进行 JSON 到 CSV 的转换？
2 场景一：转换简单的 JSON 对象列表
3 场景二：处理列表形式的 JSON 数据
4 场景三：使用 Pandas 进行高效转换（高级方法）
5 常见问题与最佳实践
6 总结与后续步骤

为什么要进行 JSON 到 CSV 的转换？

在开始编写代码之前，让我们先明确一下我们正在处理的数据格式，以及为什么要将它们互换。

JSON：灵活的数据交换王者

JSON (JavaScript Object Notation) 是一种轻量级的、基于文本的数据交换格式。它的设计初衷是易于人类阅读和编写，同时也易于机器解析和生成。

结构特点：它通常以“键值对”的形式存储数据，支持嵌套结构（对象中的对象）和数组（列表）。
主要用途：它是 Web 应用程序中前后端数据交换的标准格式。当你调用一个 API 并获得返回数据时，绝大多数情况下你拿到的是 JSON 格式。

CSV：表格数据的简洁标准

CSV (Comma Separated Values) 则是一种更加传统的、简单的文件格式。

结构特点：它将数据存储为纯文本，每一行代表一条数据记录，字段之间用逗号分隔。
主要用途：由于其极其简单的结构，它在数据分析领域占据主导地位。Excel、Google Sheets 以及像 Pandas 这样的 Python 数据分析库都能完美地读取 CSV 文件。

转换的核心逻辑：通常情况下，JSON 的键会成为 CSV 文件的表头，而 JSON 的值则会构成 CSV 文件中的具体数据行。

场景一：转换简单的 JSON 对象列表

让我们从最基础的场景开始。假设我们有一个包含员工信息的 JSON 文件，我们希望将其转换为 Excel 可以直接打开的 CSV 文件。

准备数据

假设我们的 JSON 文件 (data.json) 内容如下所示（为了便于阅读，这里展示为格式化的文本，实际文件中通常是一行或紧凑格式）：

{
    "emp_details": [
        {"id": 101, "name": "Akhil", "role": "Dev"},
        {"id": 102, "name": "Nikhil", "role": "HR"},
        {"id": 103, "name": "Dhruv", "role": "Sales"}
    ]
}

代码实现

在这个例子中，我们不仅需要读取文件，还需要处理 JSON 的嵌套结构（即访问 emp_details 这个键）。让我们来看看如何一步步实现它：

import json
import csv

# 1. 打开并读取 JSON 文件
# 使用 ‘with‘ 语句可以确保文件在操作完成后自动关闭，即使发生异常也是如此
with open(‘data.json‘, ‘r‘, encoding=‘utf-8‘) as json_file:
    # json.load() 将 JSON 文件对象直接解析为 Python 字典对象
    data_dict = json.load(json_file)

# 2. 提取我们需要的数据列表
# 在这个 JSON 中，员工数据存储在 ‘emp_details‘ 键下
emp_details_list = data_dict[‘emp_details‘]

# 3. 打开 CSV 文件准备写入
# newline=‘‘ 是 CSV 模块推荐的做法，用于防止在 Windows 系统上出现多余空行
with open(‘data_file.csv‘, ‘w‘, newline=‘‘, encoding=‘utf-8‘) as csv_file:
    # 创建 csv.writer 对象
    writer = csv.writer(csv_file)
    
    count = 0
    
    for emp in emp_details_list:
        if count == 0:
            # 第一次循环时，我们需要写入表头
            # emp.keys() 获取字典的所有键（即列名：id, name, role）
            header = emp.keys()
            writer.writerow(header)
            count += 1
        
        # emp.values() 获取字典的所有值（即具体数据）
        writer.writerow(emp.values())

print("转换成功！CSV 文件已生成。")

代码深度解析

让我们逐行拆解上面的代码，理解其中的关键点：

文件句柄管理：我们使用了 INLINECODEc54dc492 上下文管理器。这是一个 Python 最佳实践，它可以防止文件描述符泄漏。如果你手动使用 INLINECODEe0825d09 和 f.close()，一旦中间的代码报错，文件可能无法正确关闭。

提取表头：逻辑 if count == 0: 是为了确保我们只在文件的最开始写入一次表头。由于 JSON 对象列表中的每个对象通常具有相同的键，我们只需要从第一个对象中提取这些键作为 CSV 的列名。

Windows 兼容性：在打开 CSV 文件时，参数 newline=‘‘ 至关重要。如果不加这个参数，在某些 Windows 系统上写入数据时，每行数据之间可能会出现一个空白的换行，这会导致后续处理数据（比如导入 Pandas 或 Excel）时产生错位。

生成的 data_file.csv 内容如下：

id,name,role
101,Akhil,Dev
102,Nikhil,HR
103,Dhruv,Sales

场景二：处理列表形式的 JSON 数据

在实际工作中，我们经常遇到的 JSON 文件本身就是一个列表，而不是包含在一个字典对象中。例如，从数据库导出的数据或者 API 直接返回的数组。让我们看看这种情况下的处理方式。

示例数据

假设你的 jsonoutput.json 文件内容如下（为了演示方便，这里展示了格式化后的文本）

[
    {"Age": 18.0, "Salary": 20000.0, "Gender": "Male", "Country": "Germany", "Purchased": "N"},
    {"Age": 19.0, "Salary": 22000.0, "Gender": "Female", "Country": "France", "Purchased": "N"},
    {"Age": 20.0, "Salary": 24000.0, "Gender": "Female", "Country": "England", "Purchased": "N"}
]

优化后的代码实现

虽然我们可以在代码中动态获取表头，但为了保证代码的健壮性（例如，防止某些记录缺少字段），有时显式定义表头是一个更好的选择。不过，这里我们依然展示动态获取的方式，因为它更加通用。

import json
import csv

# 定义文件路径
json_file_path = ‘jsonoutput.json‘
csv_file_path = ‘jsonoutput.csv‘

try:
    with open(json_file_path, ‘r‘, encoding=‘utf-8‘) as jf:
        # 读取 JSON 数据，这里直接解析为一个 Python 列表
        data_list = json.load(jf)

    with open(csv_file_path, ‘w‘, newline=‘‘, encoding=‘utf-8‘) as f:
        writer = csv.writer(f)
        
        # 检查数据是否为空
        if not data_list:
            print("JSON 数据为空。")
        else:
            # 获取所有可能的表头（Fields）
            # 这样做可以确保如果第一个对象缺少字段，我们依然能获取完整的表头
            # 如果所有对象结构一致，直接用 data_list[0].keys() 即可
            headers = data_list[0].keys()
            writer.writerow(headers)
            
            for data in data_list:
                # 使用 get() 方法可以更安全地获取值，防止 Key Error
                # 但 writerow 需要列表，所以我们这里用列表推导式按顺序取值
                # 这样可以保证列的顺序与表头一致
                row_data = [data[header] for header in headers]
                writer.writerow(row_data)
                
    print(f"成功将 {len(data_list)} 条数据从 JSON 转换为 CSV。")

except FileNotFoundError:
    print(f"错误：找不到文件 {json_file_path}")
except json.JSONDecodeError:
    print("错误：JSON 文件格式不正确，请检查文件内容。")
except Exception as e:
    print(f"发生了一个未预期的错误: {e}")

关键改进点

异常处理：在真实环境中，文件可能会丢失，或者 JSON 格式可能会因为网络传输错误而损坏。加上 try-except 块可以让你的脚本更加健壮，而不是直接崩溃。

数据对齐：我在上面的代码中使用了 INLINECODE9cd95a2e。这是一个非常重要的细节。如果简单地使用 INLINECODE5b6146fe，在 Python 3.7+ 中虽然字典是有序的，但在更复杂的场景下（如某些键缺失），值的顺序可能会错乱。显式地按照表头的顺序提取值，可以确保每一列的数据都在正确的位置。

场景三：使用 Pandas 进行高效转换（高级方法）

虽然使用 INLINECODE1545cbb7 和 INLINECODE7f21c67c 模块可以让我们理解底层原理，但在处理大规模数据时，手动编写循环既慢又容易出错。如果你是数据科学或数据分析从业者，使用 Pandas 库是更高效的选择。

Pandas 是 Python 中进行数据分析的黄金标准工具，它提供了极其简洁的 API 来处理结构化数据。

代码实现

import pandas as pd

try:
    # 读取 JSON 文件
    # pandas 可以直接读取 JSON，甚至处理嵌套结构（需要指定 normalize 参数）
    df = pd.read_json(‘data.json‘)
    
    # 如果 JSON 是像场景一那样嵌套的 (emp_details 字段)，我们需要先提取
    # 这里假设 data.json 直接包含列表结构，或者我们已经在 read_json 中处理了路径
    # 例如：df = pd.DataFrame(data_dict[‘emp_details‘])

    # 将 DataFrame 写入 CSV
    # index=False 表示我们不将行索引（0, 1, 2...）写入文件
    df.to_csv(‘pandas_output.csv‘, index=False)
    
    print("Pandas 转换完成！")
    
except ValueError:
    print("数据格式可能不符合 Pandas 预期。")
except Exception as e:
    print(f"错误: {e}")

为什么要用 Pandas？

代码简洁：原本需要十几行的循环代码，Pandas 只需要两行（INLINECODE7b4e967f + INLINECODEcbd7488d）。
性能强大：Pandas 底层使用了 C 语言优化，处理数百万行的数据时，速度远快于 Python 原生的 for 循环。
自动处理：它会自动推断数据类型（数字、日期等），并自动处理表头。

常见问题与最佳实践

在编写了这么多转换脚本后，我想分享一些在实际开发中经常遇到的问题和解决方案。

1. 编码问题

你可能会发现，当你的 JSON 数据中包含中文字符或特殊表情符号时，生成的 CSV 文件打开后是乱码。

原因：Windows 系统下的 Excel 默认可能使用 GBK 编码，而 Python 默认使用 UTF-8。
解决方案：在打开文件时显式指定编码。对于中文环境，建议在写入 CSV 时使用 utf-8-sig（带 BOM 的 UTF-8），这样 Excel 能够自动正确识别编码。

    with open(‘output.csv‘, ‘w‘, newline=‘‘, encoding=‘utf-8-sig‘) as f:
        # ...写入代码

2. 嵌套的 JSON 结构

如果你的 JSON 数据结构非常复杂，例如某个字段的值本身又是一个字典或列表，直接转换会导致 CSV 的单元格中出现 {...} 这样的原始文本。

方案 A (手动展开)：你需要编写代码将嵌套的数据“展平”。例如，INLINECODE054f2b61 可以变成一个新的列 INLINECODE7b94cb72。
方案 B (使用 Pandas)：Pandas 提供了 pd.json_normalize() 函数，专门用于将半结构化的 JSON 数据展平为表格数据。

import pandas as pd
from pandas import json_normalize

data = [{‘id‘: 1, ‘info‘: {‘name‘: ‘Akhil‘, ‘role‘: ‘Dev‘}}]
df = json_normalize(data) 
# 这将自动生成 ‘info.name‘ 和 ‘info.role‘ 列

3. 处理缺失的字段

在 JSON 列表中，不同的对象可能缺少不同的键。例如，第一条记录有 email，第二条记录没有。

原生方法：使用 INLINECODE7b3e4b59 来安全地获取值。在构建 CSV 行时，需要遍历所有可能的表头，如果某个键不存在，则填入空字符串或 INLINECODE259d37e8。
Pandas：Pandas 会自动将缺失值填充为 NaN（空值），处理得非常优雅。

总结与后续步骤

在这篇文章中，我们全面探讨了如何在 Python 中将 JSON 转换为 CSV。我们涵盖了：

基础概念：理解 JSON 和 CSV 的结构差异。
原生实现：使用 INLINECODEd3ddba10 和 INLINECODEad9936cc 模块进行精确控制，包括处理嵌套字典和路径问题。
高级工具：利用 Pandas 库以极简的代码处理复杂的大规模数据。
实战技巧：解决了编码乱码、数据缺失和复杂数据结构等常见痛点。

给读者的建议：

如果你处理的只是小型的、一次性的配置文件转换，Python 原生方法完全足够，因为它不需要安装额外的库。但如果你正在进行数据清洗、分析或处理百万级以上的数据，强烈建议你深入学习 Pandas，它能帮你节省大量时间并减少出错的可能性。

希望这篇指南能帮助你更好地处理数据转换任务。如果你在尝试过程中遇到任何问题，或者想了解关于数据爬取和清洗的更多知识，欢迎继续探索相关的进阶教程。

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客

如何在 Python 中将 JSON 转换为 CSV：专家级指南与实战代码

为什么要进行 JSON 到 CSV 的转换？

JSON：灵活的数据交换王者

CSV：表格数据的简洁标准

场景一：转换简单的 JSON 对象列表

准备数据

代码实现

代码深度解析

场景二：处理列表形式的 JSON 数据

示例数据

优化后的代码实现

关键改进点

场景三：使用 Pandas 进行高效转换（高级方法）

代码实现

为什么要用 Pandas？

常见问题与最佳实践

1. 编码问题

2. 嵌套的 JSON 结构

3. 处理缺失的字段

总结与后续步骤

相关阅读

相关文章美国1G带宽/1T流量高速vps $17.99/年