Python实战指南：如何将Python脚本转换为专业PDF文档

2026-02-04 06:45:52 0条评论 124次阅读 0人点赞

在日常的开发工作中，我们经常面临着代码归档、技术分享或项目交付的需求。仅仅保存为 .py 文件往往不够直观，特别是在我们需要向非技术人员展示代码逻辑，或者需要生成一份结构清晰、排版优美的代码报告时。这时，将 Python 文件转换为 PDF 格式就成了一个非常实用的解决方案。

通过 PDF 格式，我们可以确保代码在任何设备上都能保持一致的排版，方便打印、存档和阅读。在 2026 年的开发环境中，随着“随处计算”和“文档即代码”理念的普及，自动化生成高质量的代码文档已成为企业级开发流程的标准配置。在这篇文章中，我们将深入探讨几种不同的方法来实现这一目标。从最基础的文本处理到复杂的自动化报告生成，我们将一起探索如何利用 Python 强大的生态系统，高效地完成“代码转文档”的任务。

1 准备工作与环境配置
2 方法一：使用 ReportLab 进行底层控制
3 方法二：使用 FPDF – 轻量级与易用性
4 2026 前沿方案：代码高亮与自动化 CI/CD 集成
5 AI 增强型文档生成：不仅仅是代码
6 故障排查与常见陷阱
7 总结与建议

准备工作与环境配置

在正式开始之前，我们需要明确一点：Python 标准库中并没有直接“将文本另存为 PDF”的万能函数。因此，我们需要借助于第三方库。无论你选择哪种方法，首先都需要确保你的 Python 环境中安装了相应的库。

为了演示方便，我们假设你有一个名为 example.py 的文件，内容如下：

# example.py
def greet(name):
    return f"Hello, {name}!"

if __name__ == "__main__":
    print(greet("Developer"))

接下来的所有示例都将围绕读取这个文件并将其内容转换为 PDF 展开。

方法一：使用 ReportLab 进行底层控制

ReportLab 是 Python 中处理 PDF 的“重型武器”。它是一个功能极其强大的库，允许我们从零开始构建 PDF 文档的每一个细节。如果你需要生成高度自定义的布局、复杂的图形或精确控制字体渲染，ReportLab 是首选。特别是在我们需要处理复杂的排版规则或嵌入自定义元数据时，它的底层控制能力显得尤为珍贵。

核心实现

让我们先看一个基础的实现方式。请注意，直接使用 drawString 读取文件内容存在局限性（比如无法自动换行），但这是理解 PDF 绘图机制的最佳起点。

from reportlab.pdfgen import canvas
from reportlab.lib.units import inch

inp = ‘example.py‘  # 输入文件路径
out = ‘output_reportlab.pdf‘  # 输出 PDF 路径

def create_basic_pdf():
    # 创建一个 PDF 画布对象
    c = canvas.Canvas(out)
    
    # 设置字体，支持中文需要注册中文字体，这里使用默认字体演示
    c.setFont("Helvetica", 12)
    
    # 读取 Python 文件内容
    try:
        with open(inp, ‘r‘, encoding=‘utf-8‘) as f:
            text_content = f.read()
            
        # 在坐标 (100, 800) 处绘制文本
        # 注意：这里的坐标是以左下角为原点 (0,0)
        # y轴从下往上增长，通常 A4 纸高度约为 842 点
        c.drawString(100, 800, "Source Code:")
        
        # 演示：简单直接打印（实际生产中不推荐直接 dump 大段文本）
        c.drawString(100, 780, text_content[:50] + "...") 
        
        c.save()
        print(f"成功使用 ReportLab 生成 PDF: {out}")
    except FileNotFoundError:
        print(f"错误：找不到文件 {inp}")

if __name__ == "__main__":
    create_basic_pdf()

深度解析与最佳实践

虽然上面的代码能生成 PDF，但你很快会发现它把所有内容挤在一行里了。在实际项目中，我们需要处理自动换行和分页。ReportLab 的 INLINECODEdf3e34d9 提供了底层绘图能力，而 INLINECODE14fe61eb 模块则提供了更高级的布局工具。

为什么手动换行很重要？

PDF 并不像 HTML 那样自动流式布局。在 PDF 中，你必须精确计算每个字符的宽度。下面的代码展示了如何改进上面的逻辑，实现真正的文本流式写入：

from reportlab.lib.pagesizes import letter
from reportlab.pdfgen import canvas

def create_advanced_pdf():
    c = canvas.Canvas("output_reportlab_advanced.pdf", pagesize=letter)
    width, height = letter
    
    text_object = c.beginText(40, height - 40) # 初始化文本对象
    text_object.setFont("Courier", 10) # 使用等宽字体适合代码展示
    text_object.setLeading(14) # 设置行高
    
    with open(inp, ‘r‘, encoding=‘utf-8‘) as f:
        lines = f.readlines()
        
        for line in lines:
            # 如果页面空间不足，新建一页
            if text_object.getY() < 40:
                c.drawText(text_object)
                c.showPage()
                text_object = c.beginText(40, height - 40)
                text_object.setFont("Courier", 10)
                text_object.setLeading(14)
            
            text_object.textLine(line.rstrip()) # 写入一行
            
    c.drawText(text_object)
    c.save()
    print("高级版 PDF (带分页) 已生成。")

方法二：使用 FPDF – 轻量级与易用性

如果你觉得 ReportLab 过于复杂，或者只是想快速生成一份简单的 PDF 报告，FPDF 是一个极好的选择。它的语法非常直观，专注于页面的构建而非底层的绘图指令。在现代微服务架构中，如果只需要轻量级的依赖，FPDF 往往是更优选。

快速上手

FPDF 最大的优势在于它内置了自动换行和分页功能。让我们看看如何优雅地处理 Python 代码的输出。

from fpdf import FPDF

def convert_with_fpdf():
    inp = ‘example.py‘
    out = ‘output_fpdf.pdf‘
    
    pdf = FPDF()
    pdf.add_page()
    
    # 设置字体：FPDF 默认不支持中文，这里使用 Courier 展示等宽代码风格
    # 实际使用中请确保加载支持中文的字体文件
    pdf.set_font("Courier", size=12)
    
    try:
        with open(inp, ‘r‘, encoding=‘utf-8‘) as f:
            content = f.read()
            
        # 使用 multi_cell 自动处理长文本换行
        # 参数：宽, 高, 内容, 边框(0=无), 对齐方式(‘L‘左对齐)
        pdf.multi_cell(0, 10, content)
        
        pdf.output(out)
        print(f"成功使用 FPDF 生成 PDF: {out}")
        
    except Exception as e:
        print(f"生成 PDF 时出错: {e}")

2026 前沿方案：代码高亮与自动化 CI/CD 集成

前面的方法虽然解决了“有和无”的问题，但在现代开发中，我们需要的是“美和易用”。黑底白字的纯文本已经无法满足团队协作的需求。我们可以利用 Pygments 进行语法高亮，再结合 WeasyPrint 将其渲染为像素级完美的 PDF。此外，这一部分我们将探讨如何将这一流程集成到 CI/CD 管道中，实现代码文档的自动化生成。

利用 Pygments 实现语法高亮

Pygments 是 Python 生态中最强大的语法高亮库，它支持数百种语言和格式。为了生成高质量的 PDF，我们可以先生成 HTML，再利用渲染引擎转换。

from pygments import highlight
from pygments.lexers import PythonLexer
from pygments.formatters import HtmlFormatter

def generate_highlighted_html(code):
    lexer = PythonLexer()
    # 使用 ‘style‘ 参数设置配色方案，如 ‘monokai‘, ‘github-dark‘
    formatter = HtmlFormatter(style=‘monokai‘, full=True, linenos=True)
    result = highlight(code, lexer, formatter)
    return result

# 使用示例
with open(‘example.py‘, ‘r‘, encoding=‘utf-8‘) as f:
    code = f.read()

html_content = generate_highlighted_html(code)
# 此时 html_content 包含了完整的 CSS 和 HTML，可以保存为 .html 或直接传给 PDF 生成器
print("HTML 内容已生成，准备转换为 PDF...")

使用 WeasyPrint 渲染 PDF

WeasyPrint 是一个支持 CSS paged media 的渲染库，这意味着我们可以像写网页一样写 PDF，支持分页、页眉页脚等高级功能。它是 2026 年生成报告的首选方案。

import weasy_print

def html_to_pdf(html_content, output_filename):
    # 我们可以直接传入 HTML 字符串
    # 为了更好的效果，通常会包裹在一个自定义的 CSS 样式中
    css_style = """
    @page {
        size: A4;
        margin: 2cm;
        @bottom-right {
            content: "Page " counter(page) " of " counter(pages);
            font-size: 10pt;
            color: #888;
        }
    }
    body {
        font-family: ‘Consolas‘, ‘Monaco‘, monospace;
    }
    """
    
    # 将 HTML 和 CSS 组合
    doc = weasy_print.HTML(string=html_content).render(stylesheets=[weasy_print.CSS(string=css_style)])
    doc.write_pdf(output_filename)
    print(f"成功生成高亮 PDF: {output_filename}")

# 结合上面的函数
# html_to_pdf(html_content, "highlighted_code.pdf")

企业级 CI/CD 集成实践

在我们最近的一个大型项目中，我们将代码归档自动化整合进了 GitHub Actions。每当有代码合并到主分支，系统会自动生成该模块的最新文档并上传到内部的文档服务器。这确保了文档永远与代码保持同步，消除了“文档过时”这一技术债。

AI 增强型文档生成：不仅仅是代码

展望 2026 年，单纯的代码展示已经不够了。我们正在见证 Agentic AI（代理式 AI） 的崛起。我们可以设计一个工作流，不仅将代码转换为 PDF，还让 AI 分析代码逻辑，自动生成“架构概览”和“决策日志”，并将这些内容合并在同一份 PDF 中。

例如，我们可以调用 LLM API 获取代码摘要，然后利用 ReportLab 将其作为封面插入：

# 伪代码：展示 AI 生成文档的逻辑
def generate_ai_cover(code_content):
    # 这里模拟调用 AI 获取摘要
    # summary = ai_model.analyze(code_content) 
    summary = "AI 生成的摘要：这是一个用于演示的高效模块..."
    return summary

def create_intelligent_pdf():
    # 读取代码
    with open(‘example.py‘, ‘r‘) as f:
        code = f.read()
    
    # 获取 AI 洞察
    insight = generate_ai_cover(code)
    
    # 使用 ReportLab 组合
    from reportlab.platypus import SimpleDocTemplate, Paragraph, Spacer, Preformatted
    from reportlab.lib.styles import getSampleStyleSheet
    
    doc = SimpleDocTemplate("ai_enhanced_report.pdf")
    styles = getSampleStyleSheet()
    story = []
    
    # 添加 AI 生成的标题
    story.append(Paragraph("AI Generated Analysis", styles[‘h1‘]))
    story.append(Paragraph(insight, styles[‘BodyText‘]))
    story.append(Spacer(1, 12))
    
    # 添加原始代码
    story.append(Paragraph("Source Code", styles[‘h2‘]))
    story.append(Preformatted(code, styles[‘Code‘]))
    
    doc.build(story)
    print("AI 增强型文档已生成。")

故障排查与常见陷阱

在我们探索这些技术的过程中，遇到过不少棘手的问题。这里分享几个最常见的坑及其解决方案，希望能帮你节省时间。

中文字体黑块问题：这是最经典的问题。无论你使用 ReportLab 还是 FPDF，默认字体都不包含中文字符。解决方法是在代码中显式注册系统字体（如 INLINECODE99c9a6cd 或 INLINECODEf8c75e5a），并使用 INLINECODEbb2cfc7a 指定该名称。如果你在 Docker 容器中运行，记得安装字体包（如 INLINECODE5514c1d0）。

DPI 与模糊问题：当你将图表（尤其是 Matplotlib 生成的）插入 PDF 时，可能会发现线条模糊。这通常是因为默认 DPI 设置过低。在保存时，请确保设置 dpi=300 或更高。

大文件内存溢出：尝试将 10,000 行代码直接读入内存并渲染成 PDF 时，纯 Python 的解决方案可能会吃掉几个 G 的内存。解决方案是采用“流式处理”，即逐页读取、渲染并写入磁盘，而不是一次性处理整个文档。

总结与建议

我们探索了从底层控制到 AI 增强的多种方法将 Python 文件转换为 PDF。每种方法都有其独特的优势和适用场景。

ReportLab：适合需要像素级控制和复杂报表生成的场景。
FPDF：适合轻量级、快速集成的脚本任务。
WeasyPrint + Pygments：这是 2026 年我们的首选方案，既能保证美观，又能处理复杂的 HTML/CSS 布局。
Agentic AI Workflow：未来的方向，不仅仅是转换格式，更是理解代码逻辑并生成智能文档。

希望这篇文章能帮助你更好地掌握 Python 文档生成的技巧！无论你是为了归档、分享还是为了满足合规性要求，选择合适的工具并建立自动化流程，都将极大地提升你的开发效率。祝编码愉快！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客