深入理解 MATLAB 中的模糊 C 均值聚类（FCM）：从理论到实战应用

2026-02-13 12:20:54 0条评论 1次阅读 0人点赞

1 前言：当数据不再“非黑即白”
2 什么是模糊 C 均值聚类？
3 MATLAB 环境准备与语法详解
4 实战演练：从基础到进阶
5 深入探讨：参数选择与常见陷阱
6 结语与后续步骤

前言：当数据不再“非黑即白”

在处理数据聚类问题时，我们经常会遇到一种棘手的情况：数据点之间的界限并不是泾渭分明的。比如在图像处理或客户细分中，某个样本可能同时具备“类别A”和“类别B”的特征。如果我们强行使用传统的 K-均值（K-Means）聚类，往往会丢失这些细微的差别。

这时，模糊 C 均值聚类就成为了我们的救星。FCM 是一种“软聚类”技术，它允许一个数据点同时属于多个簇，并给出属于每个簇的隶属度。在本文中，我们将深入探讨 FCM 的工作原理，并通过多个实战示例展示如何在 MATLAB 中高效地实现它。你将学到从基础语法到高级优化的全套技能。

—

什么是模糊 C 均值聚类？

核心概念

传统的硬聚类算法将每个数据点严格分配给一个簇，这就好比说：“这个人要么是‘高个子’，要么是‘矮个子’”。但在现实世界中，定义往往是模糊的。FCM 引入了“隶属度”的概念，取值在 0 到 1 之间。

FCM 允许数据点属于不止一个簇。这意味着，一个数据点可以以 0.8 的程度属于“簇 A”，同时以 0.2 的程度属于“簇 B”。
这种方法基于最小化目标函数，主要通过迭代来优化簇中心的位置和每个数据点的隶属度值。

它是如何工作的？

在深入 MATLAB 代码之前，让我们先在脑海中建立一个算法模型。假设我们有一组数据点集 $X = \{x1, x2, …, xn\}$ 和我们的目标簇中心集 $V = \{v1, v2, …, vc\}$。

算法的执行流程如下：

初始化：我们首先从数据集中随机选择 $c$ 个点作为初始簇中心。
计算隶属度：计算每个数据点 $xi$ 对每个簇中心 $vj$ 的隶属度 $\mu_{ij}$。这通常基于点与中心之间的距离（如欧几里得距离）。公式如下：

$$ \mu{ij} = \frac{1}{\sum{k=1}^{c} \left( \frac{d{ij}}{d{ik}} \right)^{\frac{2}{m-1}}} $$

其中，$m$ 是模糊指数（通常大于1），$d{ij}$ 是点 $xi$ 到中心 $v_j$ 的距离。

更新簇中心：根据计算出的隶属度，重新计算每个簇的中心位置 $V_j$。公式为：

$$ Vj = \frac{\sum{i=1}^{n} (\mu{ij})^m xi}{\sum{i=1}^{n} (\mu{ij})^m} $$

迭代与收敛：重复步骤 2 和 3，直到目标函数（目标函数 $J$ 衡量了加权和的平方距离）达到最小值，或者隶属度的变化小于一个极小值 $\beta$（即 $ U^{(k+1)} – U^{(k)}
< \beta$）。

—

MATLAB 环境准备与语法详解

基础语法

在 MATLAB 中，执行 FCM 聚类非常直观。最常用的形式如下：

[centers, U] = fcm(data, Nc);

data: 我们的数据集，必须是一个矩阵，每一行代表一个样本，每一列代表一个特征。
Nc: 我们想要生成的簇的数量。
centers: 输出的簇中心矩阵。
U: 模糊隶属度矩阵，包含了每个点属于每个簇的概率。

为了更好地控制算法行为，我们可以使用 options 参数：

[centers, U, objFunc] = fcm(data, Nc, options);

INLINECODE3bd4f196: 一个向量，通常包含 INLINECODE061ec53d。

* 指数（Exponent）：即模糊指数 $m$，通常默认为 2.0。

* 最大迭代次数：防止算法陷入死循环。

* 最小改进量：即终止阈值 $\beta$。

* 目标函数值 objFunc：可以帮助我们判断算法是否收敛。

数据集说明

在接下来的示例中，为了确保代码的通用性，我们将主要使用随机生成的合成数据。当然，在实际工程中，你可以轻松地替换为 Iris 数据集（鸢尾花数据集）或其他数值型数据库。只需要使用 load 命令或将数据整理成 $N \times P$ 的矩阵格式即可。

—

实战演练：从基础到进阶

让我们通过一系列实际案例，看看如何在 MATLAB 中驾驭 FCM。

示例 1：基础二维数据聚类（Hello World）

首先，我们从最简单的例子开始。我们将生成一些随机数据，看看 FCM 如何将它们分组。

% 清空工作区，确保环境整洁
clear; clc; close all;

% 1. 准备数据
% 生成 100 个随机点，包含 2 个特征（x, y 坐标）
data = rand(100, 2);

% 2. 设置参数
numClusters = 3;      % 我们想要聚成 3 类
options = [2, 100, 1e-5, 1]; % [指数m, 最大迭代, 停止阈值, 显示信息]

% 3. 执行模糊 C 均值聚类
% 这里的 [2, ...] 是指模糊指数 m=2，这是最常用的设定
[centers, U] = fcm(data, numClusters, [2.0, 100, 1e-5, 1]);

% 4. 寻找每个点的最大隶属度，以便绘图
% U 是隶属度矩阵，我们需要找到每一行的最大值索引
maxU = max(U);
index1 = find(U(1,:) == maxU);
index2 = find(U(2,:) == maxU);
index3 = find(U(3,:) == maxU);

% 注意：上面的查找逻辑其实是按列找的，更通用的按行（数据点）查找如下：
[~, cluster_idx] = max(U, 1); % 返回每列最大值的行索引（即簇编号）

% 5. 可视化结果
figure;
hold on;
% 绘制数据点，用不同颜色代表不同簇
gscatter(data(:,1), data(:,2), cluster_idx, ‘rbg‘, ‘o+*‘);
% 绘制簇中心，使用黑色五角星
plot(centers(:,1), centers(:,2), ‘k*‘, ‘MarkerSize‘, 15, ‘LineWidth‘, 3);
title(‘基础 FCM 聚类结果‘);
xlabel(‘特征 1‘);
ylabel(‘特征 2‘);
legend(‘簇 1‘, ‘簇 2‘, ‘簇 3‘, ‘簇中心‘);
hold off;

代码解读：在这个例子中，gscatter 是一个非常实用的函数，它能根据分组自动绘制不同颜色的散点图。我们注意到，簇中心通常位于各类点的几何中心，这正是 FCM 优化的结果。

示例 2：可视化隶属度与模糊性

FCM 的优势在于“模糊”。在硬聚类中，一个点只能属于一个类；但在 FCM 中，我们可以看到处于边界上的点是如何“犹豫”的。让我们通过等高线图来直观感受这一点。

% 继续使用上面的数据或重新生成
data = [rand(50,2)*0.4 + 0.2; rand(50,2)*0.4 + 0.6]; % 生成两团数据
numClusters = 2;

[centers, U] = fcm(data, numClusters, [2, 100, 1e-5, 0]);

% 获取第一个簇的隶属度作为高度值（用于画图）
% 我们可以根据需要选择 U(1,:) 或 U(2,:)
figure;
% 使用 trimesh 或 trisurf 绘制三角网格，展示隶属度的连续性
trisurf(delaunay(data(:,1), data(:,2)), data(:,1), data(:,2), U(1,:), ...
    ‘FaceColor‘, ‘interp‘, ‘EdgeColor‘, ‘none‘);
colorbar;
title(‘数据点对于“簇 1”的隶属度分布‘);
xlabel(‘X 轴‘); ylabel(‘Y 轴‘); zlabel(‘隶属度‘);
view(3);

见解：当你运行这段代码时，你会发现，在两个数据团的交界处，曲面是平滑过渡的。这正是模糊聚类的精髓——它承认了数据的中间状态。

示例 3：图像分割实战

FCM 在图像处理领域有着广泛的应用。我们可以将图像像素看作是高维空间中的点（例如 RGB 像素就是三维空间中的点），然后对这些点进行聚类。

% 1. 读取并准备图像
img = imread(‘peppers.png‘); % MATLAB 自带图像
img = im2double(img); % 转换为 double 类型 [0, 1]
img_size = size(img);

% 2. 将图像重塑为数据矩阵
% 每一行是一个像素，列是 R, G, B 特征
data = reshape(img, [], 3);

% 3. 执行 FCM 聚类
% 注意：图像数据量大，fcm 可能会比较慢，这里取 3 个簇（红、绿、背景）
numClusters = 3;
options = [2, 20, 1e-5, 1]; % 减少迭代次数以加快演示

[centers, U] = fcm(data, numClusters, options);

% 4. 根据最大隶属度重建图像
[~, max_index] = max(U, 1);
segmented_img = reshape(centers(max_index, :), img_size(1), img_size(2), 3);

% 5. 显示结果
figure;
subplot(1, 2, 1); imshow(img); title(‘原始图像‘);
subplot(1, 2, 2); imshow(segmented_img); title(‘FCM 分割结果 (3类)‘);

实用提示：在处理大图像时，直接对全部分辨率运行 FCM 可能会导致内存溢出或计算时间过长。作为最佳实践，你可以先将图像缩小，进行聚类，然后再将结果映射回原始尺寸。

—

深入探讨：参数选择与常见陷阱

如何选择“模糊指数” m？

我们在 fcm 函数中经常看到第一个参数是指数 $m$（默认值为 2.0）。

当 $m \to 1$ 时：FCM 的结果会趋近于硬聚类（K-Means）。每个点会尽量明确地归属到一个簇。
当 $m \to \infty$ 时：隶属度会趋近于 $1/c$（c 是簇数）。这意味着每个点都以相同的程度属于所有簇，聚类结果变得毫无意义。

经验法则：在大多数应用中，$m$ 在 1.5 到 3.0 之间效果较好，2.0 是最通用的选择。如果你发现分类结果过于模糊，尝试降低 $m$ 值。

常见错误与解决方案

局部最优问题：FCM 是基于梯度的优化算法，它可能会陷入局部最优。

解决方案*：多次运行 FCM（因为初始化是随机的），并选择目标函数（objFunc）最小的那次结果。

数据未归一化：如果你的数据特征具有不同的量纲（例如：年龄是 0-100，收入是 0-100000），距离计算会被大数值特征主导。

解决方案*：在使用 INLINECODE4d51a862 之前，务必使用 INLINECODE1a7cdfeb 或 mapminmax 对数据进行归一化处理。

簇数量 Nc 的确定：FCM 需要“告诉”它有多少个簇，它自己不会自动发现。

解决方案*：可以通过计算“轮廓系数”或“Xie-Beni 指数”来评估最佳簇数。简单来说，可以尝试不同的 Nc，看哪个目标函数下降最明显。

性能优化建议

向量化操作：MATLAB 的 INLINECODEfb6bfe6e 函数内部已经高度优化，但在预处理数据时，尽量避免使用 INLINECODE0eeac7fe 循环处理数据矩阵，利用矩阵索引操作会快得多。
稀疏矩阵：如果处理的是极高维的稀疏数据（如文本数据），传统的欧式距离效果可能不佳，且计算量大。此时可能需要考虑特殊的相似度度量，或者对特征进行降维（PCA）后再做 FCM。

—

结语与后续步骤

通过这篇文章，我们不仅理解了模糊 C 均值聚类的数学原理，更重要的是，我们掌握了如何在 MATLAB 中从零开始实现它。从简单的二维散点到复杂的图像分割，FCM 提供了一种比传统硬聚类更细腻的视角。

下一步建议：

尝试自己的数据：不要只依赖随机生成的 rand 数据。找一个 CSV 文件，加载进 MATLAB，尝试用 FCM 挖掘其中的隐藏结构。
结合降维使用：如果你的数据维度很高（比如超过 10 维），结合 PCA（主成分分析）先降维，再做 FCM，你会发现结果更清晰。
探索模糊逻辑工具箱：MATLAB 的 Fuzzy Logic Toolbox 还有更多高级功能，比如减法聚类用于自动初始化簇中心，值得一试。

希望这篇指南能为你的数据分析工作提供有力的帮助！如果你在实践过程中遇到代码报错，记得首先检查数据的维度和 NaN 值哦。

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客