深入理解 OpenCV 图像处理：掌握二进制图像的位运算与掩膜技术

2026-02-08 06:05:44 0条评论 1次阅读 0人点赞

在计算机视觉和图像处理的浩瀚海洋中，我们经常需要对图像的像素进行底层操作。除了常规的加减乘除算术运算，位运算 是一把处理图像的“瑞士军刀”。特别是当我们需要提取感兴趣的区域（ROI）、合成图像或处理二值图像时，按位运算不仅执行效率极高，而且能实现许多复杂的视觉效果。

在本文中，我们将深入探讨 OpenCV 中关于图像位运算的核心技术。我们将一起学习如何利用 AND（与）、OR（或）、XOR（异或） 和 NOT（非） 操作来处理图像，并理解它们在创建图像掩膜和调整特定像素属性方面的强大能力。无论你是想要给图像加个水印，还是想要把 Logo 放在特定的背景上，这篇文章都将为你提供坚实的基础。

核心概念：什么是位运算？

简单来说，位运算是直接对图像的像素二进制位进行操作的。对于 8 位图像（通常是 OpenCV 中的 uint8 类型），每个像素点的值在 0 到 255 之间。在二进制表示中，这对应于 8 个 0 或 1 的组合。

AND（与）：只有当两个对应的位都为 1 时，结果才为 1。常用于“掩膜”操作，即只保留图像中我们感兴趣的部分。
OR（或）：只要两个对应的位中有一个为 1，结果就为 1。常用于合并两个图像的背景。
XOR（异或）：当两个对应的位不同时（一个为 1，一个为 0），结果为 1。常用于检测两幅图像的差异或进行加密。
NOT（非）：将每一位取反。0 变成 1，1 变成 0。在图像中表现为“反转”颜色或亮度的补数操作。

> ⚠️ 重要提示：进行位运算时，参与运算的两幅输入图像必须具有相同的尺寸（行和列）。此外，虽然这些运算通常在二值图像上效果最直观，但它们同样完全适用于彩色图像（分别对 BGR 三个通道进行位运算）。

准备工作：输入图像

为了演示这些操作，我们需要准备两幅示例图像。你可以将它们想象成两个形状的拼图块，我们将通过代码将它们拼合或改变它们的属性。

输入图像 1：比如一个圆形或特定的 Logo。
输入图像 2：比如一个方形或背景图。

在我们的代码示例中，我们将使用 cv2.imread 加载这些图像。请注意，加载路径需要根据你本地的实际情况进行调整。

—

1. 图像的按位与（AND）运算

AND 运算的核心逻辑是“交集”。在 OpenCV 中，我们使用 cv2.bitwise_and() 函数。这就像是两个模具叠加，只有两个模具都“镂空”的地方，光线才能通过。

#### 语法与参数

cv2.bitwise_and(source1, source2, destination, mask)

source1: 第一个输入图像数组（可以是单通道灰度图，也可以是 BGR 彩色图）。
source2: 第二个输入图像数组。注意：必须与 source1 尺寸相同。
dest (可选): 输出图像数组，如果不提供，OpenCV 会自动创建。
mask (可选): 操作掩码，这是一个 8 位单通道数组。只有掩码非零的位置才会进行运算，这是 ROI（感兴趣区域）操作的关键。

#### 代码实战：提取交集

让我们看看如何使用代码实现这个功能。为了代码的健壮性，我们会加入一些检查机制和详细的中文注释。

import cv2 
import numpy as np 

# 1. 读取图像
# 请确保路径正确，或者替换为你自己的图片路径
img1 = cv2.imread(‘input1.png‘)  
img2 = cv2.imread(‘input2.png‘) 

# 检查图像是否成功加载
if img1 is None or img2 is None:
    print("错误：无法加载图像，请检查文件路径。")
    exit()

# 2. 调整尺寸（重要实践）
# 在实际项目中，两张图的大小往往不一致。
# 为了保证 bitwise 运算不出错，我们可以强制将它们调整到相同尺寸。
# 这里我们将 img2 的大小调整为与 img1 一致。
img2_resized = cv2.resize(img2, (img1.shape[1], img1.shape[0]))

# 3. 执行按位与操作
# 只有当两张图在某个像素位置都有非零值（或特定颜色）时，结果才会保留。
dest_and = cv2.bitwise_and(img1, img2_resized, mask=None)

# 4. 显示结果
cv2.imshow(‘Original Image 1‘, img1)
cv2.imshow(‘Original Image 2 (Resized)‘, img2_resized)
cv2.imshow(‘Bitwise AND Result‘, dest_and)

# 等待按键退出，0 表示无限等待
if cv2.waitKey(0) & 0xff == 27: # ESC 键退出
    cv2.destroyAllWindows()

运行结果分析：

在输出的图像中，你将看到只有两个输入图像都重叠的部分才会被显示出来。如果一张图是白色的圆，另一张是白色的方，结果就是它们重叠的白色区域，其余部分变黑（假设背景是黑色的）。这是提取图像共同特征的有力手段。

—

2. 图像的按位或（OR）运算

OR 运算的逻辑是“并集”。使用 cv2.bitwise_or()，我们只要其中一个像素点有值，结果就会保留。这就像把两张画叠在一起看，不透明的地方都会显露出来。

#### 语法与参数

cv2.bitwise_or(source1, source2, destination, mask)

参数与 bitwise_and 完全一致，但运算逻辑不同。

#### 代码实战：合并内容

import cv2 
import numpy as np 

img1 = cv2.imread(‘input1.png‘)  
img2 = cv2.imread(‘input2.png‘)

# 确保 img2 尺寸匹配 img1（实际开发中的最佳实践）
if img1.shape != img2.shape:
    img2 = cv2.resize(img2, (img1.shape[1], img1.shape[0]))

# 执行按位或操作
# 任何在 img1 或 img2 中存在的非零像素都会出现在结果中
dest_or = cv2.bitwise_or(img1, img2, mask=None)

cv2.imshow(‘Bitwise OR Result‘, dest_or)

if cv2.waitKey(0) & 0xff == 27:
    cv2.destroyAllWindows()

应用场景：OR 运算常用于合并两个图像的边界或轮廓。例如，在边缘检测后，如果你想结合水平和垂直边缘，OR 运算可以完美地将它们融合在一起，而不会像 ADD 运算那样导致像素值过饱和（即亮度爆表变白）。

—

3. 图像的按位异或（XOR）运算

XOR 运算（Exclusive OR）非常有意思。它的规则是：如果两个位相同，结果为 0；如果不同，结果为 1。在图像处理中，这常用于检测变化或反转特定区域的位。

#### 语法与参数

cv2.bitwise_xor(source1, source2, destination, mask)

#### 代码实战：非重叠区域与反转

import cv2 
import numpy as np 

img1 = cv2.imread(‘input1.png‘)  
img2 = cv2.imread(‘input2.png‘)

# 确保 img2 尺寸匹配 img1
if img1.shape != img2.shape:
    img2 = cv2.resize(img2, (img1.shape[1], img1.shape[0]))

# 执行按位异或操作
# 你会发现，只有两张图 "不重叠" 或者 "颜色不同" 的部分会被显示出来。
# 而两者重叠且颜色一致的部分会变黑（因为相同异或为0）。
dest_xor = cv2.bitwise_xor(img1, img2, mask=None)

cv2.imshow(‘Bitwise XOR Result‘, dest_xor)

if cv2.waitKey(0) & 0xff == 27:
    cv2.destroyAllWindows()

实用见解：XOR 在图像加密和数据隐藏中很有用。更重要的是，如果我们对一个图像和它自己进行 XOR 运算，结果会变成全黑（因为所有位都相同）。但如果先做 NOT 运算再做 XOR，可以实现精细的区域选择。

—

4. 图像的按位非（NOT）运算

NOT 运算最简单，它就是反转。黑变白，白变黑。在 OpenCV 中，这完全等同于计算“255 – 像素值”。

#### 语法与参数

cv2.bitwise_not(source, destination, mask)

注意这里只需要一个输入源。

#### 代码实战：图像反转效果

import cv2 
import numpy as np 

img1 = cv2.imread(‘input1.png‘)  

# 执行按位非操作
# 这个操作会反转图像的每一个像素值
dest_not = cv2.bitwise_not(img1, mask=None)

cv2.imshow(‘Original Image‘, img1)
cv2.imshow(‘Bitwise NOT (Inverted) Result‘, dest_not)

if cv2.waitKey(0) & 0xff == 27:
    cv2.destroyAllWindows()

结果：如果原图是黑底白字的 Logo，NOT 操作后就会变成白底黑字。这在某些预处理步骤中非常有用，比如为了让算法适应特定的颜色阈值。

—

进阶实战：图像掩膜的应用

学会了上面四个基本操作后，让我们来看看如何将它们组合起来解决实际问题——将 Logo 放到另一张图片的特定位置上。

这不仅仅是简单的叠加，我们希望 Logo 能够完美融合，保留其形状，同时只有 Logo 所在区域显示，其余部分透明。这就需要用到我们刚学的 INLINECODE150ff301 和 INLINECODE51646b29。

#### 场景设定

背景图：一张风景照或复杂的图像。
Logo：一张背景为黑色的 Logo 图（假设我们只想保留 Logo 本身的形状）。

#### 完整代码实现

import cv2 
import numpy as np 

def add_logo_to_background(main_img_path, logo_img_path):
    # 1. 加载图像
    main_img = cv2.imread(main_img_path)
    logo = cv2.imread(logo_img_path)

    if main_img is None or logo is None:
        print("图像加载失败")
        return

    # 2. 确定放置位置（例如：放在左上角）
    # 获取 Logo 的尺寸
    rows, cols, channels = logo.shape

    # 定义主图中感兴趣区域（ROI）的坐标，这里我们取左上角
    # 实际上我们截取主图左上角和 Logo 大小一样的一块区域
    roi = main_img[0:rows, 0:cols]

    # 3. 创建 Logo 的掩码
    # 这一步很关键：我们将 Logo 转为灰度图，然后进行二值化阈值处理。
    # 假设 Logo 背景是黑色的（0），前景是白色的（255）。
    # 如果你的 Logo 是白底黑字，逻辑需要反转。
    img2gray = cv2.cvtColor(logo, cv2.COLOR_BGR2GRAY)
    
    # 使用阈值将灰度图转为纯黑白掩码
    # 200 是阈值，可以根据你的 Logo 调整，目的是把背景变成 0，前景变成 255
    ret, mask = cv2.threshold(img2gray, 200, 255, cv2.THRESH_BINARY)
    
    # 创建反向掩码 (用于背景处理)
    # bitwise_not 会将 mask 反转：原来的背景(0)变成255，原来的前景(255)变成0
    mask_inv = cv2.bitwise_not(mask)

    # 4. 处理主图的 ROI 区域（把 Logo 放置区域涂黑）
    # 现在，我们只想从主图中抠掉要放 Logo 的地方。
    # 使用 roi 和 mask_inv 进行与运算。
    # mask_inv 中，对应 Logo 前景的位置是 0（黑），对应背景的位置是 255（白）。
    # 所以 roi_bg 中，Logo 的位置会被“涂黑”，其余保持原样。
    roi_bg = cv2.bitwise_and(roi, roi, mask=mask_inv)

    # 5. 处理 Logo 图像（只取 Logo 的前景）
    # 我们想提取 Logo 的形状。使用 mask 和 logo 进行与运算。
    # mask 中，Logo 前景是 255，背景是 0。
    # 所以 logo_fg 只保留了 Logo 本身，背景变黑。
    logo_fg = cv2.bitwise_and(logo, logo, mask=mask)

    # 6. 合并：把 Logo 放到主图的 ROI 上
    # 现在我们有 roi_bg（主图部分，Logo位置是黑的）和 logo_fg（Logo部分，背景是黑的）。
    # 把它们加起来即可完美融合。
    dst = cv2.add(roi_bg, logo_fg)

    # 7. 将处理后的 ROI 放回主图
    main_img[0:rows, 0:cols] = dst

    # 8. 显示结果
    cv2.imshow(‘Resized Logo‘, logo)
    cv2.imshow(‘Mask‘, mask)
    cv2.imshow(‘Mask Inv‘, mask_inv)
    cv2.imshow(‘ROI BG (Blackened area)‘, roi_bg)
    cv2.imshow(‘Logo FG (Isolated Logo)‘, logo_fg)
    cv2.imshow(‘Final Result‘, main_img)

    cv2.waitKey(0)
    cv2.destroyAllWindows()

# 调用函数示例（请替换为你的实际路径）
# add_logo_to_background(‘landscape.jpg‘, ‘logo.png‘)

常见问题与最佳实践

在使用 OpenCV 进行位运算时，新手（甚至老手）经常会遇到一些棘手的问题。这里有几个来自实战的经验分享：

尺寸不匹配错误：

* 错误现象：cv2.error: ... The operation is neither ‘array op array‘ ...

* 原因：你试图对两个形状不同的矩阵进行位运算。比如一张图是 1920×1080，另一张是 800×600。

* 解决方案：在运算前，务必使用 INLINECODE2ddc1452 或者先裁剪图像，确保 INLINECODE5c865353。

数据类型不一致：

* 虽然位运算对不同类型（float, uint8）很宽容，但为了性能和可预测性，建议统一保持 INLINECODE79d4d16a 格式。如果你在做除法或浮点运算导致图像变成了 float32，记得在做位运算前转回 uint8：INLINECODEeafac5aa。

颜色通道顺序（BGR vs RGB）：

* OpenCV 默认读入的是 BGR 格式，而 Matplotlib 或其他库可能使用 RGB。如果你发现颜色的位运算结果（比如掩膜）颜色不对，检查一下是不是通道顺序搞反了。INLINECODE04bdfb4f 受通道顺序影响不大，但在使用 INLINECODE2311d94d 创建掩膜时，如果是彩图转灰度，顺序不影响灰度值，所以问题不大；但如果直接对彩色通道操作，后果会很“迷幻”。

总结

通过这篇文章，我们从最基础的 AND, OR, XOR, NOT 四个运算出发，一步步探索了它们在二值图像和彩色图像中的应用。我们发现，简单的位运算是构建复杂图像处理任务（如水印合成、背景替换、ROI 提取）的基石。

我们不仅学习了单个函数的使用，还通过“添加 Logo”的实战案例，看到了如何组合 INLINECODEf102684e、INLINECODE023c42d2 和 cv2.add 来解决实际问题。

关键要点回顾：

位运算要求输入图像尺寸必须一致。
AND 用于求交集和掩膜操作。
OR 用于合并图像。
XOR 用于检测差异或反转。
NOT 用于反转图像颜色。
Mask（掩膜） 是控制位运算作用范围的关键工具。

现在，你可以尝试运行这些代码，用你自己的图片进行实验。你可以尝试改变掩膜的阈值，或者尝试结合不同的位运算创造艺术效果。图像处理的世界非常广阔，掌握位运算，你就已经拿到了打开精细操作大门的钥匙。祝你编程愉快！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客

深入理解 OpenCV 图像处理：掌握二进制图像的位运算与掩膜技术

核心概念：什么是位运算？

准备工作：输入图像

1. 图像的按位与（AND）运算

2. 图像的按位或（OR）运算

3. 图像的按位异或（XOR）运算

4. 图像的按位非（NOT）运算

进阶实战：图像掩膜的应用

常见问题与最佳实践

总结

相关文章美国1G带宽/1T流量高速vps $17.99/年