实战指南：如何使用 Python OpenCV 在视频的每一帧上绘制填充矩形

2026-02-06 00:54:09 0条评论 4次阅读 0人点赞

1 前言：为什么我们需要在视频上进行绘制？
2 核心概念：理解视频流与帧
3 深入技术细节
4 基础示例：在视频上添加一个绿色矩形
5 进阶实战：多场景应用示例
6 常见错误与解决方案
7 性能优化建议
8 总结

前言：为什么我们需要在视频上进行绘制？

在计算机视觉和视频处理的领域中，我们经常需要不仅仅是播放视频，还需要对其中的内容进行标注或修改。也许你正在构建一个人脸识别系统，需要框出检测到的人脸；又或者你在制作一个数据增强工具，需要给视频添加特定的遮挡块来训练鲁棒的 AI 模型。

今天，我们将深入探讨一个非常基础但极其强大的操作：如何使用 Python 和 OpenCV 库在视频的每一帧上绘制填充矩形。这听起来似乎很简单，但在实际工程中，理解视频的读写流、帧的坐标系以及颜色通道的细微差别，是迈向高级视频处理的第一步。

在接下来的文章中，我们将像拆解代码一样，逐步剖析每一个技术细节，并提供多种实际场景下的代码示例。让我们开始吧！

核心概念：理解视频流与帧

在动笔写代码之前，我们需要先达成一个共识：视频本质上是一连串快速播放的图片。在 OpenCV 中，我们通过 VideoCapture 对象来逐帧“抓取”这些图片。

绘制填充矩形的流程其实可以归纳为以下几个核心步骤：

初始化：加载视频，并设置好输出视频的参数（分辨率、帧率、编码格式）。
循环读取：进入一个 while 循环，每一帧我们都做三件事：读取 -> 处理（绘制） -> 写入。
绘制图形：使用 cv2.rectangle 函数，关键在于理解它的参数，特别是当我们要画“实心”矩形时的特殊参数。
资源释放：处理结束后，务必关闭窗口和释放文件句柄，防止内存泄漏。

深入技术细节

1. 创建输出对象：VideoWriter 的正确姿势

很多初学者容易在这一步出错。我们不能仅仅创建一个文件，还需要告诉 OpenCV 这个视频的“元数据”。

# 语法解析
output = cv2.VideoWriter(
    "output.avi",                    # 文件名
    cv2.VideoWriter_fourcc(*‘MPEG‘),  # 编码器（定义视频压缩格式）
    30,                              # FPS（帧率，每帧画面数）
    (1080, 1920)                     # 帧尺寸（宽，高）
)

这里有一个实战中的坑：INLINECODEae8d2be4 这个尺寸必须是整数元组，且必须严格匹配你读取的原始视频的宽和高。如果你定义的输出尺寸和原始帧不一致，INLINECODE8a6d7175 往往会失败或生成一个无法播放的文件。在后续的代码中，我会演示如何动态获取原始视频的尺寸来避免这个问题。

2. 绘制魔法：cv2.rectangle() 的奥秘

这是本文的核心。我们通常使用这个函数来画矩形框，但如何让它变成“填充”的呢？

函数原型：
cv2.rectangle(img, pt1, pt2, color, thickness, lineType, shift)

关键在于 thickness（厚度）参数：

当 thickness > 0 时：它表示矩形边框的像素宽度。
当 thickness = -1 时：这是一个特殊的标记，意味着使用颜色完全填充矩形内部。

让我们看一个具体的例子：

cv2.rectangle(frame, (100, 100), (500, 500), (0, 255, 0), -1)

这段代码会在 frame 的坐标 (100,100) 到 (500,500) 之间画一个实心的绿色矩形。

基础示例：在视频上添加一个绿色矩形

让我们把上述理论结合起来。下面的脚本将展示最基础的实现：读取一个视频，并在每一帧的固定位置画一个绿色的实心矩形，最后保存为新视频。

在这个示例中，为了方便你测试，我添加了注释，并使用了 cap.get() 来动态获取视频尺寸，这样你就不用担心尺寸不匹配的问题了。

import cv2

def main():
    # 1. 读取输入视频
    # 请确保你的工作目录下有一个 ‘input.mp4‘ 文件
    cap = cv2.VideoCapture("input.mp4")

    # 检查视频是否成功打开
    if not cap.isOpened():
        print("错误：无法打开视频文件。请检查路径。")
        return

    # 2. 获取视频属性（动态获取宽和高，这是一个好习惯）
    frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
    frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
    fps = int(cap.get(cv2.CAP_PROP_FPS))

    # 3. 创建 VideoWriter 对象准备写入
    # 我们使用 ‘XVID‘ 或 ‘MJPG‘ 编码器，兼容性较好
    fourcc = cv2.VideoWriter_fourcc(*‘XVID‘)
    output = cv2.VideoWriter("output_green_rect.avi", fourcc, fps, (frame_width, frame_height))

    while(True):
        # 逐帧读取
        ret, frame = cap.read()
        
        # ret 为 True 表示读取成功，frame 是那一帧的图像数组
        if(ret):
            # --- 核心操作开始 ---
            # 定义矩形坐标 (左上角 x, 左上角 y) -> (右下角 x, 右下角 y)
            top_left_corner = (100, 150)
            bottom_right_corner = (500, 600)
            # BGR 颜色 (0, 255, 0) 代表绿色
            color = (0, 255, 0)
            # 厚度 -1 代表填充
            thickness = -1
            
            # 在每一帧上添加填充矩形
            cv2.rectangle(frame, top_left_corner, bottom_right_corner, color, thickness)
            # --- 核心操作结束 ---
            
            # 将处理后的帧写入输出文件
            output.write(frame)
            
            # (可选) 显示当前帧，按 ‘q‘ 键退出
            cv2.imshow("Processing... Press ‘q‘ to quit", frame)
            if cv2.waitKey(1) & 0xFF == ord(‘q‘):
                break
        else:
            # 如果读不到帧（视频结束），跳出循环
            break

    # 5. 清理工作：释放资源并关闭窗口
    cv2.destroyAllWindows()
    output.release()
    cap.release()
    print("视频处理完成，已保存为 output_green_rect.avi")

if __name__ == "__main__":
    main()

进阶实战：多场景应用示例

仅仅画一个绿色的方块可能太枯燥了。让我们看看在真实开发中，我们会如何运用这个功能。

场景一：创建隐私遮罩（马赛克模拟）

假设我们需要在视频中遮挡掉某个敏感区域（比如模拟自动打码）。我们可以画一个黑色的填充矩形覆盖在特定位置。

import cv2
import numpy as np

def apply_privacy_mask(input_path, output_path):
    cap = cv2.VideoCapture(input_path)
    
    # 获取视频尺寸
    w = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
    h = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
    fps = cap.get(cv2.CAP_PROP_FPS)
    
    # 定义输出
    fourcc = cv2.VideoWriter_fourcc(*‘mp4v‘) 
    out = cv2.VideoWriter(output_path, fourcc, fps, (w, h))

    while cap.isOpened():
        ret, frame = cap.read()
        if not ret:
            break

        # --- 实战逻辑 ---
        # 假设我们需要遮挡右下角的一个区域
        # 坐标根据视频分辨率动态计算，或者写死固定坐标
        mask_start = (w - 400, h - 300) # 从右下角往左上偏移
        mask_end = (w, h)               # 到右下角结束
        
        # 使用黑色填充矩形 (0, 0, 0) 来模拟遮挡
        # 这里的 -1 至关重要，它确保了内部是不透明的
        cv2.rectangle(frame, mask_start, mask_end, (0, 0, 0), -1)
        
        # 添加文字提示（可选）
        cv2.putText(frame, "Privacy Mask", (w - 380, h - 270), 
                    cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 255), 2)

        out.write(frame)

    cap.release()
    out.release()
    print(f"隐私遮罩处理完成：{output_path}")

# 调用
# apply_privacy_mask("input.mp4", "masked_output.mp4")

场景二：半透明水印效果

标准的 cv2.rectangle 不直接支持 Alpha 通道（透明度），但我们可以通过图像加权的数学运算来实现半透明的填充效果。这在 UI 设计和数据标注中非常常用。

import cv2

def add_transparent_overlay(input_path, output_path):
    cap = cv2.VideoCapture(input_path)
    w = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
    h = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
    fps = cap.get(cv2.CAP_PROP_FPS)
    out = cv2.VideoWriter(output_path, cv2.VideoWriter_fourcc(*‘mp4v‘), fps, (w, h))

    while cap.isOpened():
        ret, frame = cap.read()
        if not ret:
            break

        # 1. 创建一个与原图大小相同的全透明图层（实际上是全黑）
        overlay = frame.copy()
        
        # 2. 在这个图层上画一个实心的蓝色矩形
        # 这里我们用 -1 填充蓝色，但在原图上它是盖住内容的
        cv2.rectangle(overlay, (50, 50), (500, 150), (255, 0, 0), -1)
        
        # 3. 应用混合公式
        # new_image = (image * alpha) + (overlay * beta) + gamma
        # alpha 控制原图的权重，beta 控制覆盖层的权重
        # 如果我们想要 50% 的透明度，我们可以让各占 50%
        cv2.addWeighted(overlay, 0.6, frame, 0.4, 0, frame)
        
        # 注意：上面的操作直接修改了 frame 变量
        
        out.write(frame)
        
    cap.release()
    out.release()
    print("半透明叠加层处理完成")

场景三：动态位置填充（随帧数移动）

有时候填充区域不是静止的。比如我们要模拟一个移动的物体，或者一个扫描效果。这涉及到了帧数的计算。

import cv2
import numpy as np

def draw_dynamic_rect(input_path, output_path):
    cap = cv2.VideoCapture(input_path)
    # 使用 MJPG 编码器对于 .avi 文件通常比较安全
    out = cv2.VideoWriter(output_path, cv2.VideoWriter_fourcc(*‘MJPG‘), 20.0, 
                          (int(cap.get(3)), int(cap.get(4))))
    
    frame_count = 0
    while cap.isOpened():
        ret, frame = cap.read()
        if not ret:
            break
            
        frame_count += 1
        h, w = frame.shape[:2]
        
        # --- 动态逻辑 ---
        # 让矩形的 x 坐标随着帧数增加而移动，并加上取模运算防止越界
        move_speed = 5
        rect_x = (frame_count * move_speed) % (w - 200)
        
        # 绘制一个移动的红色填充条
        cv2.rectangle(frame, (rect_x, 100), (rect_x + 100, 200), (0, 0, 255), -1)
        
        out.write(frame)
        
        if cv2.waitKey(1) & 0xFF == ord(‘q‘):
            break
            
    cap.release()
    out.release()
    print("动态矩形绘制完成")

常见错误与解决方案

在与开发者交流的过程中，我发现有几个问题是大家经常遇到的。让我们一起来排查一下。

1. 输出视频文件过大或无法播放

这通常是因为编码器 (INLINECODE62b1f784) 选择不当。例如，直接保存 RAW 格式的视频会占用巨大的硬盘空间。推荐使用 INLINECODEcf2bae5c (用于 .mp4) 或 INLINECODE5fe84b2a/INLINECODE349b2104 (用于 .avi)。

2. 输出视频只有几毫秒或者打不开

这几乎总是因为 INLINECODE699924ce 中设置的 帧尺寸 和实际写入的 INLINECODEedd68678 的尺寸不一致。

检查方法：在写入前打印 INLINECODE2656d3be，确保它等于 INLINECODEf99a53c9。注意 OpenCV 通常是 INLINECODEe7934dda 在前，而 INLINECODE15034f50 的尺寸参数是 (width, height)，这里容易弄反。

3. 颜色显示异常

如果你发现本该是红色的矩形变成了蓝色，不要慌张。OpenCV 默认使用 BGR 格式（蓝-绿-红），而不是我们习惯的 RGB。

红色：(0, 0, 255)
蓝色：(255, 0, 0)
绿色：(0, 255, 0)

性能优化建议

当我们处理高分辨率视频（如 4K）时，Python 的循环可能会成为瓶颈。

减少 I/O 操作：INLINECODEfd734f03 非常耗时。如果你只是在后台批量处理视频，务必注释掉 INLINECODE20c84542 和 cv2.waitKey。这能将处理速度提升数倍。
使用 ROI (感兴趣区域)：如果你的矩形很小，不要处理整个画面。先将帧的 ROI 切片出来，处理完后再放回去（虽然对于简单的矩形绘制，直接操作全图通常更快，但在复杂滤镜中 ROI 很有用）。

总结

通过这篇文章，我们不仅仅学习了如何使用 cv2.rectangle(frame, ..., -1) 这一行代码，更一起探索了 OpenCV 处理视频的完整生命周期。从基础的静态矩形，到半透明水印，再到动态位置的逻辑，这些都是构建复杂视觉应用的基础积木。

掌握这些基础操作后，你可以尝试结合 cv2.putText 添加文字标签，或者利用颜色检测技术实现自动在特定颜色的物体上绘制矩形。技术的世界很大，OpenCV 只是把关人，而创意在于你。

希望这篇文章能帮助你解决实际问题！如果你在配置环境或编码过程中遇到任何问题，欢迎随时交流。祝你编码愉快！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客