Python OpenCV实战指南：如何高效地将处理后的画面写入视频文件

2026-02-04 14:21:47 0条评论 3次阅读 0人点赞

在本教程中，我们将一起深入探讨如何使用 Python 中的 OpenCV 库来处理视频数据，并将其高效地写入到磁盘文件中。视频处理是计算机视觉领域中最核心的技能之一，无论是制作简单的视频剪辑工具，还是构建复杂的实时监控系统，掌握如何从零开始创建和写入视频文件都是必不可少的一步。

很多人在学习 OpenCV 时，能够轻松地读取并显示视频帧，但在将处理后的结果保存为新文件时往往会遇到各种棘手的问题，比如保存的视频打不开、画面尺寸不匹配、甚至是几秒钟的视频文件体积高达几个 GB。别担心，我们将在这篇文章中彻底解决这些问题。

我们将从最基础的概念讲起，逐步深入到代码实现，最后分享一些实际开发中的优化技巧和避坑指南。让我们开始这段探索之旅吧！

理解视频写入的核心机制

在动手写代码之前，我们需要先达成一个共识：视频文件本质上是由一系列连续的图像（帧）加上音频（可选）封装而成的。在 OpenCV 中，写入视频的过程其实就是一个循环：读取一帧 -> 处理一帧 -> 写入一帧。

为了将视频保存到磁盘，我们需要使用 cv2.VideoWriter 这个核心类。但在创建这个对象之前，我们必须明确告诉它四个关键参数，缺一不可：

文件名：输出视频的保存路径（例如 ‘output.avi‘）。
FourCC 代码：这是一个 4 字节的代码，用于指定视频的编码格式（如 MJPG, MP4V, H264 等）。编码器决定了视频的压缩方式和兼容性。
帧率 (FPS)：每秒要播放多少帧画面。通常我们需要与原视频保持一致，否则会出现快放或慢放的情况。
帧尺寸：每一帧图像的宽度和高度。注意：这里必须是元组格式。

基础实现：绘制并保存矩形

让我们从一个经典的例子开始：读取视频，在每一帧上绘制一个绿色的矩形，然后保存为新视频。

在下面的代码中，我们将学习如何构建写入管道。

#### 示例 1：基础视频写入流程

import cv2

def process_video_basic():
    # 1. 创建读取对象
    # 请确保当前目录下有 ‘input.mp4‘，或者替换为你自己的视频路径
    cap = cv2.VideoCapture("input.mp4")

    # 2. 获取视频源的关键参数
    # 这一点非常重要！为了保持输出视频与输入一致，我们需要读取原视频的宽、高和帧率
    width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
    height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
    fps = cap.get(cv2.CAP_PROP_FPS)

    # 3. 定义编码器和创建 VideoWriter 对象
    # ‘XVID‘ 是一个非常流行的 MPEG-4 编码器兼容性标识，通常生成的 .avi 文件兼容性最好
    fourcc = cv2.VideoWriter_fourcc(*‘XVID‘) 
    
    # 输出文件名, 编码器, 帧率, 尺寸
    output = cv2.VideoWriter("output_basic.avi", fourcc, fps, (width, height))

    print(f"正在处理视频，分辨率: {width}x{height}, FPS: {fps}")

    while cap.isOpened():
        ret, frame = cap.read()
        
        # 如果读取成功 (ret 为 True)
        if ret:
            # --- 图像处理区域 ---
            # 在坐标 (100,100) 到 (500,500) 之间绘制一个绿色矩形，线宽为 3
            cv2.rectangle(frame, (100, 100), (500, 500), (0, 255, 0), 3)
            # -------------------

            # 将处理后的帧写入输出文件
            output.write(frame)

            # 显示预览窗口（可选，用于调试）
            cv2.imshow(‘Frame‘, frame)

            # 按 ‘q‘ 键退出循环
            if cv2.waitKey(1) & 0xFF == ord(‘q‘):
                break
        else:
            # 视频读取完毕或发生错误
            break

    # 4. 清理资源
    cap.release()
    output.release()
    cv2.destroyAllWindows()
    print("视频处理并保存完成。")

if __name__ == "__main__":
    process_video_basic()

代码解读：

在这个示例中，你可能注意到了我们没有像之前那样硬编码分辨率。在实际开发中，这是一个最佳实践。我们利用 cap.get() 动态获取原视频的属性，这样无论输入是 1080p 还是 4K 视频，我们的代码都能自动适应输出。

进阶实战：捕获摄像头画面并录制

除了处理现有的视频文件，INLINECODE55d0fa95 更常见的用途是配合 INLINECODEfa462761（摄像头索引）来录制屏幕或摄像头画面。这在制作监控小工具或录制操作演示时非常有用。

在这个例子中，我们不再读取文件，而是实时捕获摄像头画面并保存。

#### 示例 2：从摄像头录制视频到文件

import cv2
import datetime

def record_from_webcam():
    # 打开默认摄像头（通常是索引 0）
    cap = cv2.VideoCapture(0)

    # 检查摄像头是否成功打开
    if not cap.isOpened():
        print("错误：无法访问摄像头")
        return

    # 获取摄像头的默认分辨率
    frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
    frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))

    # 定义编码器
    # 对于 .mp4 格式，使用 ‘mp4v‘ 是一个安全的选择
    fourcc = cv2.VideoWriter_fourcc(*‘mp4v‘) 
    
    # 生成带时间戳的文件名，防止覆盖
    timestamp = datetime.datetime.now().strftime("%Y%m%d_%H%M%S")
    filename = f"webcam_recording_{timestamp}.mp4"

    # 创建输出对象
    out = cv2.VideoWriter(filename, fourcc, 20.0, (frame_width, frame_height))

    print("开始录制... 按 ‘q‘ 键停止录制。")

    while True:
        ret, frame = cap.read()
        
        if not ret:
            print("无法从摄像头获取帧")
            break

        # 可以在这里添加文字水印，显示录制时间
        cv2.putText(frame, "Recording...", (50, 50), 
                    cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2)

        # 写入帧
        out.write(frame)

        # 实时显示
        cv2.imshow(‘Webcam‘, frame)

        # 按 ‘q‘ 退出
        if cv2.waitKey(1) & 0xFF == ord(‘q‘):
            break

    # 释放资源
    cap.release()
    out.release()
    cv2.destroyAllWindows()
    print(f"录制已保存为: {filename}")

if __name__ == "__main__":
    record_from_webcam()

实用见解：

在这个例子中，我们在录制时使用 INLINECODE08c573e4 添加了一个 "Recording…" 的水印。这是很多监控软件的标配功能。此外，我们还使用了 INLINECODEdfe7d364 模块来动态生成文件名。这一点非常实用，它可以防止你每次运行程序时都覆盖上一次的录像。

深入探讨：灰度视频与颜色空间陷阱

你现在可能已经掌握了基本的彩色视频写入方法。但是，如果你在处理一些计算机视觉算法（如边缘检测、人脸识别）时，通常需要先将图像转换为灰度图。这时候，如果你直接尝试写入灰度帧，很可能会得到一个空白的视频文件。

为什么？因为 VideoWriter 在初始化时已经默认建立了处理彩色图像（3通道）的通道。如果你试图写入单通道的灰度图，OpenCV 往往会因为数据不匹配而静默失败。

#### 示例 3：正确写入灰度（黑白）视频

要解决这个问题，我们需要在创建 VideoWriter 对象时，显式地告诉它我们将处理灰度图像，或者将灰度图转回 BGR 格式。让我们看看两种方法。

import cv2

def write_grayscale_video_method1():
    cap = cv2.VideoCapture("input.mp4")
    
    # 获取参数
    width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
    height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
    fps = cap.get(cv2.CAP_PROP_FPS)
    
    # 创建输出对象 (彩色模式)
    fourcc = cv2.VideoWriter_fourcc(*‘XVID‘)
    # 方法1：创建彩色 VideoWriter，但在写入前将灰度图转回 BGR
    # 虽然这看起来多此一举，但这能确保任何播放器都能正确打开它
    out = cv2.VideoWriter("output_gray_bgr.avi", fourcc, fps, (width, height))

    while cap.isOpened():
        ret, frame = cap.read()
        if not ret:
            break

        # 转换为灰度图
        gray_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        
        # --- 关键步骤 ---
        # VideoWriter 期望的是 (Height, Width, 3) 的 BGR 图像
        # 灰度图是 (Height, Width, 1)
        # 我们需要利用 cv2.cvtColor 将其转回 "假的 BGR"
        gray_bgr = cv2.cvtColor(gray_frame, cv2.COLOR_GRAY2BGR)
        
        out.write(gray_bgr)
        
        cv2.imshow(‘Gray‘, gray_frame)
        if cv2.waitKey(1) & 0xFF == ord(‘q‘):
            break
            
    cap.release()
    out.release()
    cv2.destroyAllWindows()

def write_grayscale_video_method2():
    cap = cv2.VideoCapture("input.mp4")
    
    width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
    height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
    fps = cap.get(cv2.CAP_PROP_FPS)
    
    fourcc = cv2.VideoWriter_fourcc(*‘XVID‘)
    
    # 方法2：使用 isColor=False 参数
    # 这告诉 VideoWriter 我们将写入单通道图像
    out = cv2.VideoWriter("output_gray_real.avi", fourcc, fps, (width, height), isColor=False)

    while cap.isOpened():
        ret, frame = cap.read()
        if not ret:
            break

        gray_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        
        # 现在可以直接写入原始灰度帧了
        out.write(gray_frame)
        
        if cv2.waitKey(1) & 0xFF == ord(‘q‘):
            break
            
    cap.release()
    out.release()
    cv2.destroyAllWindows()

# 你可以分别运行这两个函数来测试效果

这个例子向我们展示了 INLINECODE0bd0af7b 构造函数中那个鲜为人知的 INLINECODE7c0f694d 参数的威力。默认情况下它是 True，这就是为什么直接写入灰度图会失败的原因。

高级应用：创建延时摄影视频

让我们看一个更有趣的应用：制作延时摄影视频。假设你有一系列按顺序命名的图片（例如从网络摄像头每隔几秒抓取的图片），你想把它们合成为一个视频流。

#### 示例 4：将图片序列合成为视频

import cv2
import os
import glob

def create_timelapse():
    # 图片所在的目录
    image_folder = ‘images/‘
    # 输出视频路径
    video_name = ‘timelapse.avi‘
    
    # 获取所有图片文件，这里假设是 jpg 格式，并按文件名排序
    images = [img for img in os.listdir(image_folder) if img.endswith(".jpg")]
    images.sort() # 确保顺序正确
    
    # 读取第一张图片来确定宽和高
    frame = cv2.imread(os.path.join(image_folder, images[0]))
    height, width, layers = frame.shape
    
    # 初始化 VideoWriter
    fourcc = cv2.VideoWriter_fourcc(*‘XVID‘)
    # 延时摄影通常帧率较低，这里设为 10 fps
    video = cv2.VideoWriter(video_name, fourcc, 10.0, (width, height))

    print(f"正在合并 {len(images)} 张图片...")

    for image in images:
        video.write(cv2.imread(os.path.join(image_folder, image)))

    cv2.destroyAllWindows()
    video.release()
    print("延时摄影视频生成完毕！")

常见错误与性能优化指南

在实际开发中，你可能会遇到以下几个“坑”。让我们一起看看如何避开它们。

#### 1. FourCC 编码器的选择

你可能会发现，有时候代码运行完美，但生成的 .avi 文件却无法用 Windows 自带的播放器打开。这通常是因为 FourCC 编码器的问题。

INLINECODE9df3ac16 或 INLINECODE3286dfe1：最通用，生成的文件通常 .avi 后缀，几乎所有播放器都支持。
INLINECODEb033724f：对应 INLINECODE1afef250 格式。虽然它是 MPEG-4 标准，但在某些老旧的 Windows 系统上可能需要安装解码器（如 K-Lite Codec Pack）才能播放。
INLINECODE76bba1e5：这是目前最流行的压缩标准，文件小画质好。但 OpenCV 默认构建的 INLINECODE50d0c316 往往不支持 H264 编码（需要依赖额外的 FFmpeg 库编译）。如果你坚持使用 H264，通常推荐使用 Python 的 ffmpeg-python 库配合 OpenCV 使用，但这已经超出了 OpenCV 本身的范畴。

建议：初学者或需要兼容性时，首选 INLINECODEd5dd097d 配合 INLINECODE9f456993 后缀。

#### 2. 尺寸不匹配

错误信息通常是 INLINECODE2f1e181c。这发生在你尝试写入的帧尺寸与 INLINECODE6f8dd037 初始化时指定的尺寸不一致时。

例如，你初始化时写的是 INLINECODE2457bd57 (宽x高)，但读取到的视频实际上是竖屏的，或者反过来。解决方案：永远使用 INLINECODE424ca5ae 来动态获取尺寸，不要手动猜测。

#### 3. 性能优化：写入频率

如果你不需要在处理过程中实时预览（cv2.imshow），请务必注释掉显示相关的代码。图像显示（GUI 渲染）是非常消耗资源的操作，可能会严重拖慢你的视频写入速度。在纯后台处理模式下，写入速度往往能达到实时速度的几倍。

总结

在今天的教程中，我们不仅学习了如何使用 OpenCV 写入视频，还从零构建了从摄像头录制、灰度视频处理到图片序列合并等多个实用场景的解决方案。

我们发现，成功写入视频的关键在于：正确初始化 VideoWriter 对象（特别是分辨率和 FourCC 编码），以及在循环中保持帧数据的一致性。现在你可以自信地修改示例代码，将它们应用到你自己的项目中去——无论是制作自动化视频剪辑脚本，还是构建视觉分析系统。

希望这篇文章对你有帮助。如果你在运行代码时遇到任何问题，或者想了解关于 OpenCV 的更多高级技巧，欢迎随时与我们交流。继续加油！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客