深入理解局部二值模式（LBP）：使用 OpenCV 和 Python 从零实现纹理分析

2026-02-04 04:10:41 0条评论 1次阅读 0人点赞

1 引言
2 基础概念：图像即像素矩阵
3 什么是局部二值模式 (LBP)？
4 手动计算 LBP：算法拆解
5 Python 实现指南
6 实战中的优化与进阶技巧
7 实际应用场景
8 总结

引言

在计算机视觉领域，我们经常面临的挑战之一是如何让计算机“理解”图像中的内容。除了识别物体是什么（比如猫还是狗），理解物体的表面特征——也就是“纹理”——同样至关重要。你有没有想过，我们是如何一眼分辨出粗糙的树皮和光滑的玻璃的？这种视觉能力对于机器来说，可以通过一种非常强大却出奇简单的算法来实现，它就是局部二值模式（Local Binary Pattern，简称 LBP）。

在这篇文章中，我们将深入探讨 LBP 的核心概念。我们不会仅仅停留在理论层面，而是会从最基础的像素操作开始，一步步教你如何使用 Python 和 OpenCV 从零构建一个完整的 LBP 实现。无论你是在做人脸识别、物体分类，还是工业表面的缺陷检测，理解 LBP 都将为你的工具箱增添一件利器。让我们开始吧！

基础概念：图像即像素矩阵

首先，让我们回顾一下图像在计算机眼中是什么样子的。众所周知，数字图像本质上就是像素值的集合。当我们在计算机中以数字形式存储图像时，实际存储的是其对应的像素强度矩阵。

在 Python 中使用 OpenCV 读取图像时，该变量实际上存储的就是这些像素值。让我们通过一段代码来看看这背后的数据结构。

示例 1：读取并查看图像的原始数据

import cv2

# 读取图像
image = cv2.imread("example.jpg")

# 检查图像数据类型和形状
print(f"图像数据类型: {image.dtype}")
print(f"图像维度 (高度, 宽度, 通道数): {image.shape}")

# 打印图像矩阵的一部分
# 实际上，变量 ‘image‘ 存储了图像的像素值
print("图像左上角 3x3 区域的像素值:
", image[:3, :3])

当你运行这段代码时，你会看到类似下方的输出（假设是一张彩色图像）：

[[[255 255 255]
  [255 255 255]
  [255 255 255]
  ...

 [[255 255 255]
  [255 255 255]
  [255 255 255]
  ...
 ...

这些三维数组中的每一个数字代表了一个像素点在 BGR（蓝、绿、红）通道上的强度。对于 LBP 来说，我们通常处理的是灰度图像，这样每个像素点就只有一个强度值。这是我们需要掌握的第一个关键点。

什么是局部二值模式 (LBP)？

局部二值模式是一种非常高效的纹理描述算子。它的核心思想是：通过比较中心像素与其邻域像素的灰度值，来捕捉局部纹理特征。这就好比我们用手去触摸物体表面，指尖感受到的凹凸不平就是纹理。

LBP 最大的优点包括：

计算简单：不需要复杂的数学运算，主要是比较和位运算。
灰度不变性：当光照均匀变化导致图像整体变亮或变暗时，LBP 特征基本保持不变。
旋转不变性（改进版）：虽然原始 LBP 不具备旋转不变性，但通过后续的改进可以轻松实现。

手动计算 LBP：算法拆解

在写代码之前，让我们先通过一个直观的例子来理解 LBP 的计算规则。这能帮助我们更好地理解后续的代码逻辑。

算法步骤：

选取中心像素：假设我们选取了一个灰度值为 149 的像素作为中心点。
选取邻域：选取其周围 8 个像素，组成一个 3×3 的矩阵。
阈值处理：将这 8 个邻域像素的值分别与中心值（149）进行比较。

* 如果邻域值 大于或等于 中心值，标记为 1。

* 如果邻域值小于中心值，标记为 0。

生成二进制代码：按顺时针（或逆时针）顺序收集这些 0 和 1，得到一个 8 位的二进制数（例如：11100001）。
转换为十进制：将这个二进制数转换为十进制（例如 225），这个新数值就是该中心像素的 LBP 特征值。

实例演示

假设我们的 3×3 区域像素值如下（中心值为 149）：

[160, 155, 140]
[150, 149, 120]
[110, 100, 115]

比较过程（顺时针，从左上角开始）：

160 >= 149 -> 1
155 >= 149 -> 1
140 >= 149 -> 0
120 >= 149 -> 0
100 >= 149 -> 0
110 >= 149 -> 0
115 >= 149 -> 0 (注意：这里演示的是一种简化逻辑，通常我们会绕一圈)

(注：为了演示清晰的数学转换，让我们假设生成的二进制序列是 11100001)
十进制计算：

$$1 \times 2^7 + 1 \times 2^6 + 1 \times 2^5 + 0 \times 2^4 + 0 \times 2^3 + 0 \times 2^2 + 0 \times 2^1 + 1 \times 2^0$$

$$= 128 + 64 + 32 + 0 + 0 + 0 + 0 + 1 = 225$$

最终，原来的中心像素值 149 将被替换为 225。我们对图像中的每一个像素都重复这个过程，就能得到整张图的 LBP 特征图。

Python 实现指南

现在，让我们把上述逻辑转化为 Python 代码。我们将不直接调用 INLINECODEd7ee84d2 等高级库中的现成函数，而是使用 INLINECODE3f7da574 和 NumPy 手动实现。这能让你对算法细节有完全的控制权。

示例 2：定义核心计算函数

我们需要两个辅助函数：

get_pixel: 安全地获取像素值（处理图像边界）。
lbp_calculated_pixel: 计算特定像素的 LBP 值。

import cv2
import numpy as np
from matplotlib import pyplot as plt

def get_pixel(img, center, x, y):
    """
    用于获取邻域像素并进行阈值处理的辅助函数。
    
    参数:
    img -- 输入灰度图像
    center -- 中心像素的灰度值
    x, y -- 邻域像素的坐标
    
    返回:
    1 如果邻域像素值 >= 中心值，否则返回 0
    """
    new_value = 0
    
    try:
        # 比较邻域像素与中心像素
        if img[x][y] >= center:
            new_value = 1
    except IndexError:
        # 异常处理：处理图像边界
        # 当中心像素位于边缘时，其部分邻域可能超出图像范围
        # 这里我们选择忽略（默认为0），或者你可以选择其他边界填充策略
        pass
    
    return new_value

def lbp_calculated_pixel(img, x, y):
    """
    计算特定位置 像素的函数。
    """
    center = img[x][y]
    
    # 用于存储周围 8 个像素的二进制值（0或1）
    val_ar = []
    
    # 按顺时针顺序收集阈值（从左上角开始）
    # 1. 左上
    val_ar.append(get_pixel(img, center, x-1, y-1))
    # 2. 上方
    val_ar.append(get_pixel(img, center, x-1, y))
    # 3. 右上
    val_ar.append(get_pixel(img, center, x-1, y + 1))
    # 4. 右侧
    val_ar.append(get_pixel(img, center, x, y + 1))
    # 5. 右下
    val_ar.append(get_pixel(img, center, x + 1, y + 1))
    # 6. 下方
    val_ar.append(get_pixel(img, center, x + 1, y))
    # 7. 左下
    val_ar.append(get_pixel(img, center, x + 1, y-1))
    # 8. 左侧
    val_ar.append(get_pixel(img, center, x, y-1))
    
    # 将二进制值转换为十进制数
    # 这里的权值对应顺时针顺序: 2^0 到 2^7
    power_val = [1, 2, 4, 8, 16, 32, 64, 128]

    val = 0
    for i in range(len(val_ar)):
        val += val_ar[i] * power_val[i]
        
    return val

示例 3：生成完整的 LBP 图像

现在我们已经有了核心逻辑，接下来我们需要遍历整张图像，生成新的 LBP 图像。注意：由于我们要处理 3×3 的邻域，最外圈的一圈像素无法计算完整的 LBP，因此新图像的尺寸会比原图略小，或者我们需要填充边界。为了演示清晰，我们这里保留有效区域。

def process_image_with_lbp(image_path):
    # 1. 读取图像并转换为灰度图
    img_color = cv2.imread(image_path)
    if img_color is None:
        print("错误：无法加载图像，请检查路径。")
        return

    # 转换为灰度图 (0-255)
    img_gray = cv2.cvtColor(img_color, cv2.COLOR_BGR2GRAY)
    
    # 2. 创建一个空图像用于存储 LBP 结果
    # 注意：这里我们创建了一个和原图一样大的全零矩阵
    # 但实际上边界像素会被跳过或保持为0
    height, width = img_gray.shape
    lbp_img = np.zeros((height, width), np.uint8)

    # 3. 遍历图像中的每个像素（除去最外圈边界）
    # 范围从 1 到 height-1 和 width-1，防止数组越界
    for i in range(1, height - 1):
        for j in range(1, width - 1):
            # 调用我们之前定义的函数计算 LBP 值
            lbp_img[i, j] = lbp_calculated_pixel(img_gray, i, j)

    # 4. 可视化结果
    plt.figure(figsize=(10, 5))
    
    plt.subplot(1, 2, 1)
    plt.imshow(cv2.cvtColor(img_color, cv2.COLOR_BGR2RGB)) # Matplotlib 使用 RGB
    plt.title("原始图像")
    plt.axis("off")

    plt.subplot(1, 2, 2)
    # 使用 ‘gray‘ 色图显示 LBP 结果
    plt.imshow(lbp_img, cmap="gray")
    plt.title("LBP 特征图")
    plt.axis("off")

    plt.show()

# 调用函数处理图像
# 请确保目录下有一张名为 ‘texture.jpg‘ 的图片，或者替换为你自己的图片路径
# process_image_with_lbp("texture.jpg")

实战中的优化与进阶技巧

虽然上面的代码解释了原理，但在实际工程应用中，我们通常需要对代码进行优化，或者使用更高效的参数设置。以下是你在开发过程中可能会用到的一些实用建议。

1. 使用 NumPy 进行向量化加速（性能优化）

上面的 for 循环在处理大图时非常慢。在 Python 中，我们应该尽量利用 NumPy 的矩阵运算能力来替代显式循环。虽然实现向量化 LBP 稍微复杂一些（通常涉及将图像数组平移以比较邻域），但这对于实时应用至关重要。

简单的优化思路：

不要一个个像素处理，而是将图像分别向 8 个方向平移。
将平移后的 8 个图像与原图像进行比较，生成 8 个二值矩阵。
将这 8 个矩阵乘以对应的权重（1, 2, 4, …）并相加。

这将使计算速度提升数十倍。

2. 扩展的 LBP (Extended LBP)

我们上面使用的是 3×3 的邻域（半径 R=1，采样点 P=8）。但在实际应用中，为了捕捉更大范围的纹理特征，我们可以增加半径和采样点数量。

半径 (R): 决定了局部纹理的覆盖范围。比如 R=2，意味着我们要在距离中心 2 个像素的圆周上采样。
采样点 (P): 决定了特征的精细程度。P=16 或 P=24 能提供更丰富的纹理信息。

当你使用圆形邻域时，坐标计算通常涉及插值，因为像素并不总是落在整数坐标上。OpenCV 和 skimage 库中内置的 LBP 函数通常支持这些参数的设置。

3. 常见错误与解决方案

图像未转为灰度：这是最常遇到的错误。直接对彩色图进行 LBP 计算通常没有意义，因为彩色图有 3 个通道。务必先使用 cv2.cvtColor 转换。
边界效应：我们上面的代码简单忽略了边界（结果图有一圈黑边）。在实际生产中，你可能需要使用 cv2.copyMakeBorder 对图像进行填充，然后再计算 LBP，最后再裁剪回来，以保证输出图像尺寸与输入一致。

实际应用场景

掌握 LBP 后，你可以将其应用到许多有趣的项目中：

纹理分类：比如区分布料、金属、木材等材质。
人脸识别：LBP 用于提取人脸的局部特征，生成直方图，然后用于分类器（如 LBPH 人脸识别器）。
医疗影像分析：辅助识别 X 光片或 CT 片中的特定组织纹理。

总结

在本文中，我们深入探索了局部二值模式（LBP）的世界。从理解图像矩阵的本质开始，我们一步步手动推导了 LBP 的计算公式，并用 Python 实现了它。我们不仅学习了代码实现，还探讨了其背后的原理、优化策略以及实际应用中需要注意的事项。

虽然现代深度学习在视觉任务中占据主导，但 LBP 凭借其极低的计算成本和出色的灰度不变性，依然在边缘计算、嵌入式系统以及作为深度学习预处理步骤中占有一席之地。希望这篇文章能帮助你更好地理解纹理特征的奥秘，并鼓励你动手尝试修改代码，探索更高级的计算机视觉技术。

现在，你可以尝试运行上面的代码，观察不同类型图像（如平滑的渐变图 vs 粗糙的噪点图）生成的 LBP 特征图有何不同，从而加深对纹理描述符的直观理解。

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客