深入浅出实战：基于 Python 与 OpenCV 的实时多颜色检测系统

2026-02-07 07:17:35 0条评论 4次阅读 0人点赞

在现代机器人视觉和自动化领域，让机器"看见"并理解颜色是一项基础但极其关键的能力。除了物体检测，赋予机器人感知特定颜色的能力，能极大地扩展其在复杂环境中的应用潜力。

试想一下，如果我们可以让程序实时识别出流水线上红色标记的次品，或者让自动驾驶汽车精准地识别交通信号灯，这将为智能化带来多大的提升？在这篇文章中，我们将深入探讨如何使用 Python 和 OpenCV 库构建一个强大的实时多颜色检测系统。我们将从基础概念出发，逐步剖析核心算法，最终实现一个能够同时追踪红、绿、蓝三种颜色的完整应用。

为什么颜色检测如此重要？

在我们深入代码之前，先来看看这项技术在实际场景中是如何发挥作用的。理解这些应用场景有助于我们更好地设计代码逻辑：

自动驾驶与辅助驾驶：车辆通过摄像头实时捕捉交通信号灯的状态（红、黄、绿）以及路边的各种交通标志颜色，从而做出正确的行驶决策。
工业自动化分拣：在物流或制造业中，机械臂需要根据包裹或零件的颜色标签，将其分类到不同的传送带或篮子中。例如，将红色的苹果和绿色的苹果分开。
增强现实（AR）与交互：通过追踪特定颜色的标记物（如蓝色的笔帽），我们可以让计算机屏幕上的虚拟物体与手持的实物进行实时交互。

准备工作：核心工具库

在开始动手之前，我们需要确保已经配置好了必要的 Python 环境。本项目主要依赖两个强大的库：

OpenCV (cv2)：这是一个开源的计算机视觉和机器学习库，包含了数百种计算机视觉算法。我们将主要使用它来进行图像捕获、色彩空间转换和形态学处理。
NumPy：这是 Python 的基础科学计算库。OpenCV 中的图像数据在 Python 中通常以 NumPy 数组的形式存在，因此我们用它来进行高效的矩阵运算。

你可以通过以下命令安装这两个库（如果尚未安装）：

pip install opencv-python numpy

原理揭秘：从 BGR 到 HSV 的转换

这是整个颜色检测流程中最关键的一步，也是很多初学者容易卡住的地方。

在计算机屏幕上，我们通常使用 RGB 颜色模型（在 OpenCV 中默认顺序是 BGR）。这是一种基于三原色光的加色模型，虽然它很适合显示，但在处理颜色识别时却存在一个巨大的问题：光照条件的变化会极大地影响 RGB 的数值。比如，同一个红色物体，在强光下和阴影下，其 RGB 数值可能相差甚远，导致我们设定的颜色阈值失效。

为了解决这个问题，我们通常会将图像从 BGR 空间转换到 HSV（色调、饱和度、亮度） 色彩空间。

Hue (色调)：代表颜色的种类（如红、绿、蓝），用 0 到 180 度的角度来表示。
Saturation (饱和度)：代表颜色的纯度，即颜色中混入白光的多少，范围是 0 到 255。
Value (明度)：代表颜色的亮度，范围是 0 到 255。

为什么 HSV 更好？ 通过将"颜色"（Hue）与"亮度"（Value）分离，我们只需要关注 Hue 通道，就能在很大程度上抵抗光照变化带来的干扰。这就是我们在代码中首先要做 cv2.cvtColor 的原因。

实战步骤详解

让我们构建这个系统。我们将整个过程分解为清晰的步骤，这样你可以完全掌控每一个细节。

#### 1. 捕获视频流

首先，我们需要让程序"看见"外部世界。我们将使用 INLINECODEeedfd5a5 来调用电脑默认的摄像头。这里的 INLINECODEedc499fc 代表第一个摄像头设备，如果你有外接 USB 摄像头，可以尝试改为 1。

#### 2. 定义颜色阈值

我们需要告诉程序什么是"红色"，什么是"蓝色"。在 HSV 空间中，我们定义一个下限和一个上限。任何处于这两个值之间的像素，都会被判定为目标颜色。

红色：比较特殊，因为它在色环的 0 度（红色）和 180 度（也是红色）两端，所以通常需要定义两个区间或者使用跨越逻辑。为了演示方便，我们在代码中设定了较宽的范围。
绿色：通常位于中间色域。
蓝色：位于高色域。

#### 3. 创建掩膜

利用 cv2.inRange() 函数，我们可以生成一张"黑白图"（掩膜）。在这张图中，目标颜色区域是白色的（255），其余部分是黑色的（0）。这极大地简化了后续的处理工作。

#### 4. 形态学变换（去噪）

现实世界的图像总是充满噪声的。掩膜生成后，除了目标物体，可能还会残留一些零散的噪点。我们使用"膨胀"操作，可以让目标区域的白色像素膨胀，填补内部的空洞，同时也能增强连接性。代码中我们使用 cv2.dilate 和一个 5×5 的内核来实现这一步。

#### 5. 轮廓提取与绘制

最后，我们在处理好的掩膜上寻找轮廓。如果轮廓的面积大于一定阈值（比如 300 像素），我们就认为检测到了有效物体。随后，我们在原始图像帧上绘制矩形框和文本标签，完成最终的视觉反馈。

完整代码实现与深度解析

下面是经过详细注释的完整代码。我已经对变量命名进行了优化，使其更符合 Python 的编码规范，并添加了中文注释，帮助你理解每一行的作用。

import numpy as np 
import cv2 

# 初始化摄像头
# 参数 0 表示尝试获取系统默认的摄像头设备
webcam = cv2.VideoCapture(0) 

# 检查摄像头是否成功打开
if not webcam.isOpened():
    print("错误：无法访问摄像头，请检查设备连接。")
    exit()

# 开始主循环，实时读取视频帧
while(1): 
    
    # 读取视频流中的一帧
    # read() 返回两个值：一个是布尔值(表示是否读取成功)，一个是图像帧
    _, imageFrame = webcam.read() 

    # 步骤 1：色彩空间转换
    # 将图像从 BGR (默认) 转换为 HSV (色调-饱和度-亮度)
    # 这对于颜色分割至关重要，因为它将颜色信息与亮度信息分离
    hsvFrame = cv2.cvtColor(imageFrame, cv2.COLOR_BGR2HSV) 

    # ---------------------------
    # 定义红色的 HSV 范围并生成掩膜
    # ---------------------------
    # 红色在 HSV 中比较特殊，通常分布在 0-10 和 160-180 之间
    # 这里为了演示简便，定义了一个较宽的单一区间 (注意：这可能不是最优的红色区间，但足以应对大多数情况)
    red_lower = np.array([136, 87, 111], np.uint8) 
    red_upper = np.array([180, 255, 255], np.uint8) 
    red_mask = cv2.inRange(hsvFrame, red_lower, red_upper) 

    # ---------------------------
    # 定义绿色的 HSV 范围并生成掩膜
    # ---------------------------
    green_lower = np.array([25, 52, 72], np.uint8) 
    green_upper = np.array([102, 255, 255], np.uint8) 
    green_mask = cv2.inRange(hsvFrame, green_lower, green_upper) 

    # ---------------------------
    # 定义蓝色的 HSV 范围并生成掩膜
    # ---------------------------
    blue_lower = np.array([94, 80, 2], np.uint8) 
    blue_upper = np.array([120, 255, 255], np.uint8) 
    blue_mask = cv2.inRange(hsvFrame, blue_lower, blue_upper) 
    
    # ---------------------------
    # 形态学变换：膨胀
    # ---------------------------
    # 这一步用于去除掩膜中的噪声（即那些孤立的白色噪点）
    # 同时也能填充物体内部的黑色空洞
    kernel = np.ones((5, 5), "uint8") 
    
    # 对红色掩膜进行膨胀处理
    red_mask = cv2.dilate(red_mask, kernel) 
    # 应用掩膜：只保留原图中对应的颜色区域
    res_red = cv2.bitwise_and(imageFrame, imageFrame, 
                            mask = red_mask) 
    
    # 对绿色掩膜进行膨胀处理
    green_mask = cv2.dilate(green_mask, kernel) 
    res_green = cv2.bitwise_and(imageFrame, imageFrame, 
                                mask = green_mask) 
    
    # 对蓝色掩膜进行膨胀处理
    blue_mask = cv2.dilate(blue_mask, kernel) 
    res_blue = cv2.bitwise_and(imageFrame, imageFrame, 
                            mask = blue_mask) 

    # ---------------------------
    # 红色轮廓检测与绘制
    # ---------------------------
    contours, hierarchy = cv2.findContours(red_mask, 
                                        cv2.RETR_TREE, 
                                        cv2.CHAIN_APPROX_SIMPLE) 
    
    for pic, contour in enumerate(contours): 
        area = cv2.contourArea(contour) 
        # 过滤掉面积过小的噪声区域（阈值设为 300）
        if(area > 300): 
            x, y, w, h = cv2.boundingRect(contour) 
            # 在图像上绘制矩形框，颜色为 (0, 0, 255) 即 BGR 模式的红色
            imageFrame = cv2.rectangle(imageFrame, (x, y), 
                                    (x + w, y + h), 
                                    (0, 0, 255), 2) 
            
            # 添加文本标签 "Red Colour"
            cv2.putText(imageFrame, "Red Colour", (x, y), 
                        cv2.FONT_HERSHEY_SIMPLEX, 1.0, 
                        (0, 0, 255)) 	

    # ---------------------------
    # 绿色轮廓检测与绘制
    # ---------------------------
    contours, hierarchy = cv2.findContours(green_mask, 
                                        cv2.RETR_TREE, 
                                        cv2.CHAIN_APPROX_SIMPLE) 
    
    for pic, contour in enumerate(contours): 
        area = cv2.contourArea(contour) 
        if(area > 300): 
            x, y, w, h = cv2.boundingRect(contour) 
            # 绘制绿色矩形框 (0, 255, 0)
            imageFrame = cv2.rectangle(imageFrame, (x, y), 
                                    (x + w, y + h), 
                                    (0, 255, 0), 2) 
            
            cv2.putText(imageFrame, "Green Colour", (x, y), 
                        cv2.FONT_HERSHEY_SIMPLEX, 
                        1.0, (0, 255, 0)) 

    # ---------------------------
    # 蓝色轮廓检测与绘制
    # ---------------------------
    contours, hierarchy = cv2.findContours(blue_mask, 
                                        cv2.RETR_TREE, 
                                        cv2.CHAIN_APPROX_SIMPLE) 
    
    for pic, contour in enumerate(contours): 
        area = cv2.contourArea(contour) 
        if(area > 300): 
            x, y, w, h = cv2.boundingRect(contour) 
            # 绘制蓝色矩形框 (255, 0, 0)
            imageFrame = cv2.rectangle(imageFrame, (x, y), 
                                    (x + w, y + h), 
                                    (255, 0, 0), 2) 
            
            cv2.putText(imageFrame, "Blue Colour", (x, y), 
                        cv2.FONT_HERSHEY_SIMPLEX, 
                        1.0, (255, 0, 0)) 

    # ---------------------------
    # 结果展示
    # ---------------------------
    # 程序会显示三个窗口：
    # 1. 原始摄像头画面（带有检测框）
    # 2. 仅显示红色的掩膜结果（调试用）
    # 3. 仅显示绿色的掩膜结果（调试用）
    cv2.imshow("Multiple Color Detection in Real-Time", imageFrame) 
    # cv2.imshow("Red Mask", red_mask) # 你可以取消注释这几行来查看具体的掩膜效果
    # cv2.imshow("Green Mask", green_mask)
    
    # 等待用户按键，‘q‘ 键退出循环
    if cv2.waitKey(10) & 0xFF == ord(‘q‘): 
        webcam.release() # 释放摄像头资源
        cv2.destroyAllWindows() # 关闭所有窗口
        break

进阶优化与常见问题排查

虽然上面的代码已经可以工作了，但在实际开发中，你可能会遇到一些挑战。这里有几个实用的建议，帮助你让系统更加健壮：

#### 1. 如何找到最准确的 HSV 阈值？

这是新手遇到的最大痛点。我们在代码中提供的数值（如 [136, 87, 111]）是基于特定光照环境的参考值。如果你在昏暗的房间里测试，效果可能会很差。

解决方案： 你可以编写一段简单的调试代码，截取一帧画面，并创建滑动条来动态调整 HSV 的上下限，直到在掩膜窗口中只剩下你想检测的物体。

# 简单的调试思路代码片段
import cv2
import numpy as np

def nothing(x):
    pass

cv2.namedWindow(‘Tracking‘)
# 创建滑动条
# 注意：OpenCV 中 Hue 范围是 0-179
# 这里我们以红色为例

cv2.createTrackbar("LH", "Tracking", 0, 179, nothing) # Lower Hue
cv2.createTrackbar("LS", "Tracking", 0, 255, nothing) # Lower Saturation
cv2.createTrackbar("LV", "Tracking", 0, 255, nothing) # Lower Value
cv2.createTrackbar("UH", "Tracking", 179, 179, nothing) # Upper Hue
cv2.createTrackbar("US", "Tracking", 255, 255, nothing) # Upper Saturation
cv2.createTrackbar("UV", "Tracking", 255, 255, nothing) # Upper Value

while True:
    frame = ... # 读取你的摄像头
    hsv = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)

    l_h = cv2.getTrackbarPos("LH", "Tracking")
    l_s = cv2.getTrackbarPos("LS", "Tracking")
    l_v = cv2.getTrackbarPos("LV", "Tracking")
    u_h = cv2.getTrackbarPos("UH", "Tracking")
    u_s = cv2.getTrackbarPos("US", "Tracking")
    u_v = cv2.getTrackbarPos("UV", "Tracking")

    l_b = np.array([l_h, l_s, l_v])
    u_b = np.array([u_h, u_s, u_v])

    mask = cv2.inRange(hsv, l_b, u_b)

    res = cv2.bitwise_and(frame, frame, mask=mask)

    cv2.imshow("frame", frame)
    cv2.imshow("mask", mask)
    cv2.imshow("res", res)

    key = cv2.waitKey(1)
    if key == 27:
        break

cv2.destroyAllWindows()

#### 2. 环境光的影响

如果你的应用场景是在工厂里，头顶的灯光可能会产生闪烁，导致 HSV 值波动。除了使用 HSV 空间外，你还可以尝试在预处理阶段增加"高斯模糊"（cv2.GaussianBlur），这能有效平滑图像，减少高频噪声的干扰。

# 在转换为 HSV 之前添加
imageFrame = cv2.GaussianBlur(imageFrame, (5, 5), 0)

#### 3. 性能优化

在上述代码中，我们对红、绿、蓝三个通道分别进行了检测和循环处理。如果是在树莓派等性能受限的设备上运行，这可能会导致帧率（FPS）下降。

优化建议：

降低分辨率：读取摄像头后，可以使用 cv2.resize() 将图像缩小（例如缩小到 640×480），因为对于颜色检测来说，极高的像素并不是必须的。
按需检测：如果这一帧只需要检测红色，就不要去运行绿色和蓝色的逻辑。根据状态机来决定检测哪种颜色，可以节省大量的 CPU 资源。

总结与下一步

通过这篇文章，我们不仅仅是一行行地复制粘贴代码，而是真正理解了计算机视觉中色彩检测的本质。我们学会了如何利用 HSV 空间来对抗光照干扰，掌握了掩膜和形态学变换的威力，并动手实现了一个能实时追踪多种颜色的系统。

你现在已经掌握了让机器"看见"颜色的基础技能。试着调整代码中的参数，或者尝试检测除了红绿蓝之外的其他颜色（比如黄色、紫色），你会发现这个过程非常有趣且充满成就感。快去试试看吧，记得在实验中调整好你的光照环境哦！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客