如何使用 Python 高效地将 JSON 数据转换为 Excel 文件

2026-02-09 13:24:30 0条评论 87次阅读 0人点赞

在日常的开发和数据工作中，我们经常需要在不同的数据格式之间进行转换。JSON（JavaScript Object Notation）作为一种轻量级的数据交换格式，非常适合 Web API 和应用程序之间的数据传输。然而，当我们需要进行深入的数据分析、制作报表或者与非技术团队分享数据时，Excel（.xlsx）往往是我们更倾向于使用的格式。

你是否曾收到过一个巨大的 JSON 文件，却不知如何快速查看其中的数据？或者你需要定期将数据库导出的 JSON 报表自动转换为 Excel 格式发送给管理层？

在本文中，我们将深入探讨如何使用 Python 强大的数据处理能力，将 JSON 数据无缝转换为 Excel 电子表格。我们将不仅仅满足于基本的转换，还会一起探索如何处理复杂的嵌套数据、如何美化 Excel 表格以及如何自动化这一过程。无论你是数据分析师还是后端开发人员，这篇文章都将为你提供实用的解决方案。

1 准备工作：安装必要的 Python 库
2 场景一：基础转换 —— 将简单的 JSON 转换为 Excel
3 场景二：处理多条数据 —— JSON 数组转换为 Excel
4 场景三：进阶挑战 —— 处理复杂的嵌套 JSON
5 实战技巧：如何优化你的 Excel 输出
6 常见问题与最佳实践
7 总结

准备工作：安装必要的 Python 库

在开始编码之前，我们需要确保 Python 环境中已经安装了处理数据的核心库。Python 拥有极其丰富的生态系统，但对于“JSON 转 Excel”这一任务，我们主要依赖以下两个库：

Pandas：这是 Python 数据科学领域的“瑞士军刀”。它提供了高效的数据结构和数据分析工具。我们将使用它来读取和处理 JSON 数据，并将其整理为 DataFrame（类似于 Excel 中的表格结构）。
Openpyxl：这是一个专门用于读写 .xlsx 文件的库。Pandas 在底层依赖它来与 Excel 文件进行交互。

打开你的终端或命令行工具，运行以下命令来安装这些库：

pip install pandas openpyxl

安装完成后，我们就可以开始动手实践了。

场景一：基础转换 —— 将简单的 JSON 转换为 Excel

首先，让我们从最简单的场景开始。假设我们有一个包含少量信息的 JSON 对象，我们想把它放入 Excel 表格中。

第一步：准备 JSON 数据

在你的项目文件夹中创建一个名为 data.json 的文件，并粘贴以下内容：

{
    "name": "TechCompany",
    "domain": "example.com",
    "city": "Shanghai",
    "is_active": true
}

第二步：读取并加载数据

在 Python 中，我们使用内置的 json 模块来读取文件，并将其转换为 Python 的字典对象。然后，我们利用 Pandas 将这个字典转换为 DataFrame。

创建一个名为 convert.py 的文件，并编写以下代码：

import json
import pandas as pd

# 1. 打开并读取 JSON 文件
# 使用 ‘with‘ 语句可以确保文件在操作完成后自动关闭
try:
    with open(‘data.json‘, ‘r‘, encoding=‘utf-8‘) as file:
        # json.load() 将文件内容直接解析为 Python 字典
        data = json.load(file)
        print("成功读取 JSON 数据：", data)
except FileNotFoundError:
    print("错误：找不到 data.json 文件，请检查路径。")
    exit()

# 2. 将数据转换为 Pandas DataFrame
# 因为我们的原始数据是单个对象（字典），所以我们需要将其放入列表中
# 这样 DataFrame 才能将其识别为一行数据
df = pd.DataFrame([data])

print("
DataFrame 内容预览：")
print(df)

# 3. 将 DataFrame 导出为 Excel 文件
# index=False 参数非常重要，它告诉 Pandas 不要将 DataFrame 的行索引（0, 1, 2...）写入 Excel
# 这样我们的 Excel 表格会更加干净整洁
output_filename = ‘simple_output.xlsx‘
df.to_excel(output_filename, index=False)

print(f"
成功！文件已保存为 {output_filename}")

运行上述代码后，你会在文件夹中发现一个 simple_output.xlsx。打开它，你会看到数据已经整齐地排列在表格中了。

场景二：处理多条数据 —— JSON 数组转换为 Excel

在实际工作中，我们更常遇到的是包含多条记录的 JSON 数组。比如，一份用户列表或是一系列的订单记录。让我们看看如何处理这种情况。

准备数据

修改你的 data.json 文件，或者创建一个新的 users.json 文件，内容如下：

[
    {"id": 101, "name": "Alice", "role": "Admin", "city": "Beijing"},
    {"id": 102, "name": "Bob", "role": "User", "city": "Shanghai"},
    {"id": 103, "name": "Charlie", "role": "User", "city": "Shenzhen"}
]

代码实现

这次的处理逻辑与之前略有不同，因为 json.load() 直接返回的是一个列表，Pandas 可以直接将其转换为 DataFrame，每一项列表元素对应表格的一行。

import json
import pandas as pd

# 读取 JSON 数组数据
file_path = ‘users.json‘
with open(file_path, ‘r‘, encoding=‘utf-8‘) as f:
    data_list = json.load(f)

# 这里不再需要 [data]，因为 data 本身已经是一个列表
df = pd.DataFrame(data_list)

# 我们可以在导出前对数据进行简单的操作
# 例如：只导出特定列，或者按城市排序
# df = df[[‘name‘, ‘city‘]] # 仅选择特定列

# 导出到 Excel
output_filename = ‘users_list.xlsx‘
df.to_excel(output_filename, index=False)

print(f"已将 {len(df)} 条用户数据导出到 {output_filename}")

这个脚本会生成一个包含三行数据的 Excel 表格，表头自动生成为 INLINECODE6c5371ae, INLINECODEc6f39aac, INLINECODE16d6f9ae, 和 INLINECODEa0a2c41c。

场景三：进阶挑战 —— 处理复杂的嵌套 JSON

你可能会问：“如果我的 JSON 结构非常复杂，包含嵌套的对象，该怎么办？”这是数据处理中最常见的问题之一。

假设我们有一个更复杂的 JSON 文件 nested_data.json：

[
    {
        "employee_id": 1,
        "name": "David",
        "department": "Engineering",
        "skills": ["Python", "Java", "Go"]
    },
    {
        "employee_id": 2,
        "name": "Eva",
        "department": "HR",
        "skills": ["Communication", "Recruitment"]
    }
]

如果我们直接使用 INLINECODE60aed727，INLINECODE4ef439f0 字段（列表）会以难以阅读的形式出现在 Excel 中。为了解决这个问题，我们需要对数据进行“扁平化”处理。

解决方案：使用 `json_normalize`

Pandas 提供了一个非常强大的函数 pd.json_normalize()，专门用于处理这种半结构化数据。

import json
import pandas as pd

with open(‘nested_data.json‘, ‘r‘, encoding=‘utf-8‘) as f:
    data = json.load(f)

# 使用 json_normalize 来展开数据
df = pd.json_normalize(
    data,
    # 我们可以指定如何分隔嵌套字段，这里使用点号或者下划线
    sep=‘_‘  # 这将把 skills 列中的列表内容转化为字符串，或者根据配置展开
)

# 注意：json_normalize 默认会将列表转化为字符串形式，例如 "[‘Python‘, ‘Java‘]"
# 如果你希望每个技能单独成一列，或者需要更复杂的处理，通常需要编写自定义的扁平化逻辑。

# 在这个例子中，让我们简单地将列表转换为用分号分隔的字符串，方便 Excel 阅读
def clean_skills(row):
    if isinstance(row[‘skills‘], list):
        return "; ".join(row[‘skills‘])
    return row[‘skills‘]

df[‘skills‘] = df.apply(clean_skills, axis=1)

df.to_excel(‘employees.xlsx‘, index=False)
print("处理嵌套数据完成。")

实战技巧：如何优化你的 Excel 输出

仅仅把数据导出出来往往是不够的。为了让报告更加专业，我们通常需要对 Excel 文件进行格式化。虽然 Pandas 的 INLINECODE34f603bc 主要关注数据导出，但我们可以结合 INLINECODEbd1cabb6 和 openpyxl 的引擎来做更多事情。

示例：添加表头格式和自动调整列宽

下面的代码展示了如何在导出数据的同时，给表头添加颜色背景，并自动调整列宽以适应内容。

import pandas as pd
import json
from openpyxl.styles import Font, PatternFill

# 1. 准备数据
data = [
    {"Product": "Laptop", "Price": 1200, "Stock": 50},
    {"Product": "Mouse", "Price": 25, "Stock": 200},
    {"Product": "Keyboard", "Price": 80, "Stock": 150}
]
df = pd.DataFrame(data)

# 2. 使用 ExcelWriter 进行更精细的控制
filename = ‘formatted_report.xlsx‘

with pd.ExcelWriter(filename, engine=‘openpyxl‘) as writer:
    # 将数据写入工作簿
    df.to_excel(writer, sheet_name=‘Report‘, index=False)
    
    # 获取 workbook 和 worksheet 对象
    workbook = writer.book
    worksheet = writer.sheets[‘Report‘]
    
    # 3. 定义格式样式
    header_font = Font(bold=True, color="FFFFFF")
    header_fill = PatternFill(start_color="4F81BD", end_color="4F81BD", fill_type="solid")
    
    # 4. 遍历第一行（表头）应用样式
    for cell in worksheet[1]:
        cell.font = header_font
        cell.fill = header_fill

    # 5. 自动调整列宽（这是一个非常实用的功能）
    for column in worksheet.columns:
        max_length = 0
        column_letter = column[0].column_letter
        for cell in column:
            try:
                if len(str(cell.value)) > max_length:
                    max_length = len(str(cell.value))
            except:
                pass
        adjusted_width = (max_length + 2) * 1.2
        worksheet.column_dimensions[column_letter].width = adjusted_width

print(f"已生成格式化的报表：{filename}")

常见问题与最佳实践

在将 JSON 转换为 Excel 的过程中，你可能会遇到一些“坑”。作为经验丰富的开发者，让我们来看看如何避免它们。

1. 编码问题

你可能会发现导出的 Excel 文件中中文显示为乱码。这通常是因为在打开文件时编码不匹配，或者写入时未指定 UTF-8。虽然 INLINECODEbb2a0254 在较新版本的 Pandas 中默认处理得很好，但在读取 JSON 文件时，建议始终显式指定 INLINECODE6c4a44ea。

2. 日期格式的处理

JSON 中的日期通常是字符串（例如 "2023-10-01"）。Pandas 在读取时通常会将其识别为字符串。如果你希望在 Excel 中将其作为日期类型处理，可以在 INLINECODE313a3ed8 之前使用 INLINECODEdddd262c 转换列的数据类型：

df[‘transaction_date‘] = pd.to_datetime(df[‘transaction_date‘])
df.to_excel(‘output.xlsx‘, index=False)

3. 处理超大文件

如果你的 JSON 文件有几百兆甚至更大，直接 INLINECODE1921edb9 到内存可能会导致电脑卡死。对于这种情况，我们建议使用 INLINECODE90741529 并且配合 INLINECODEae4c2ff3 参数（如果是行分隔的 JSON），或者使用流式解析库如 INLINECODE9aef8db1 来逐块读取和写入 Excel，但这通常涉及到分 Sheet 存储的策略。

4. 缺失值的处理

现实世界的数据往往是不完美的。JSON 中某些字段可能缺失（INLINECODE2043baae）。在 Pandas 中，这些会被转换为 INLINECODE89330f78（Not a Number）。导出到 Excel 时，这些单元格会显示为空白。如果你希望用特定的值（如 0 或 "N/A"）填充，可以使用 df.fillna() 方法：

df.fillna("N/A", inplace=True)

总结

在本文中，我们像探索一条技术路线图一样，从最基础的概念开始，一步步学习了如何使用 Python 将 JSON 数据转换为 Excel 文件。我们不仅掌握了基础的 INLINECODE645d2177 和 INLINECODE8ec5f532 用法，还深入研究了如何处理列表数据、如何扁平化嵌套的复杂 JSON 结构，以及如何通过 INLINECODE35afb046 和 INLINECODEe0fcbc44 为我们的报表添加专业的格式。

掌握这项技能后，你将不再需要手动复制粘贴数据到 Excel 中。你可以编写一个简单的脚本，一键完成从原始 API 数据到精美报表的转换过程。这不仅极大地提高了工作效率，也减少了人为操作带来的错误风险。

既然你已经掌握了这些代码，不妨尝试一下你自己的数据集？或者，你可以尝试将这些步骤封装成一个可复用的函数，方便在未来的项目中直接调用。祝你在数据处理的旅程中收获满满！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客

如何使用 Python 高效地将 JSON 数据转换为 Excel 文件

准备工作：安装必要的 Python 库

场景一：基础转换 —— 将简单的 JSON 转换为 Excel

第一步：准备 JSON 数据

第二步：读取并加载数据

场景二：处理多条数据 —— JSON 数组转换为 Excel

准备数据

代码实现

场景三：进阶挑战 —— 处理复杂的嵌套 JSON

解决方案：使用 `json_normalize`

实战技巧：如何优化你的 Excel 输出

示例：添加表头格式和自动调整列宽

常见问题与最佳实践

1. 编码问题

2. 日期格式的处理

3. 处理超大文件

4. 缺失值的处理

总结

相关文章美国1G带宽/1T流量高速vps $17.99/年

如何使用 Python 高效地将 JSON 数据转换为 Excel 文件

准备工作：安装必要的 Python 库

场景一：基础转换 —— 将简单的 JSON 转换为 Excel

第一步：准备 JSON 数据

第二步：读取并加载数据

场景二：处理多条数据 —— JSON 数组转换为 Excel

准备数据

代码实现

场景三：进阶挑战 —— 处理复杂的嵌套 JSON

解决方案：使用 json_normalize

实战技巧：如何优化你的 Excel 输出

示例：添加表头格式和自动调整列宽

常见问题与最佳实践

1. 编码问题

2. 日期格式的处理

3. 处理超大文件

4. 缺失值的处理

总结

相关文章美国1G带宽/1T流量高速vps $17.99/年

解决方案：使用 `json_normalize`