深入理解 KNN 算法中的决策边界：从理论到可视化实践

2026-02-15 14:49:30 0条评论 1次阅读 0人点赞

在机器学习的分类任务中，你有没有想过模型是如何在空间中将不同的类别区分开来的？或者，当你训练好一个模型后，它在底层是如何“思考”并决定一个数据点属于类别 A 还是类别 B 的？这一切的核心，就在于我们今天要深入探讨的主题——决策边界。

在这篇文章中，我们将不仅停留在概念层面，还会通过实际的代码示例，带你一步步领略 K-近邻算法（KNN）中决策边界的形成机制。你将学到什么是决策边界，它与几何图形（如沃罗诺伊图）的关系，以及最关键的一点——参数 K 的变化是如何像魔法一样改变这些边界的形状。我们将结合 Python 代码进行实战演练，展示如何优化这些边界，并讨论在实际项目中可能遇到的陷阱和最佳实践。

什么是决策边界？

简单来说，决策边界就是特征空间中的一条“线”（在二维中）或者一个“曲面”（在高维中）。它就像是一道分界线，将空间划分为不同的区域，每个区域代表了模型预测的一个特定类别。当新的数据点落入某个区域时，模型就会根据该区域的标签来赋予它相应的类别。

对于 K-近邻算法 (KNN) 而言，其核心假设是“物以类聚”，即相似的数据点在特征空间中彼此靠得很近。因此，KNN 的决策边界并没有一个显式的数学公式（不像逻辑回归那样是一条直线），而是基于训练数据在空间中的局部分布动态生成的。

决策边界的核心影响因素

KNN 的决策边界并不是凭空产生的，它的形状和位置主要取决于以下两个关键因素：

K 值的大小：即我们在进行分类时参考多少个“邻居”。
距离度量标准：即我们如何定义两点之间的“远近”（如欧几里得距离、曼哈顿距离等）。

为了让你更直观地理解，我们可以将 KNN 的决策边界想象成地形图上的等高线。训练数据就像是山峰或山谷，而 K 值则决定了我们是看微观地形（K 小）还是宏观地形（K 大）。

使用 Voronoi 图进行可视化：1-NN 的特例

在深入了解 K 值的影响之前，让我们先看一种特殊的可视化工具——Voronoi 图（沃罗诺伊图）。它实际上就是当 $k=1$ 时 KNN 决策边界的完美展现。

!420046938

#### Voronoi 图与 KNN 的内在联系

Voronoi 图通过一组种子点（在这里就是我们的训练数据点）将空间分割成若干个区域。每个区域（称为 Voronoi 单元）包含所有距离该特定训练点最近的点。

几何定义：两点 $pi$ 和 $pj$ 之间的边界线，实际上是连接这两点的线段的垂直平分线。这意味着，在这条线上的任意一点，到 $pi$ 和 $pj$ 的距离是完全相等的。
分类含义：如果我们把训练点按类别标记颜色，Voronoi 图就直观地展示了 KNN 如何工作。当一个新数据点落入某个区域，我们就可以断定它属于该区域中心那个点的类别。

因此，当 $k=1$ 时，KNN 的决策边界就直接对应于训练点的 Voronoi 图的边缘。这时的边界通常是高度不规则、紧紧包裹着训练数据的，这也就是为什么 1-NN 模型容易对训练数据过拟合的几何解释。

!knn-decision-boundafries

KNN 如何定义决策边界：深入解析

虽然 Voronoi 图解释了 $k=1$ 的情况，但在实际应用中，我们通常会使用更大的 $k$ 值。这时，决策边界不再是简单的垂直平分线，而是由多个邻居的“投票”结果共同决定的。

#### 1. ‘K‘ 值对决策边界的影响

这是 KNN 算法中最重要的概念之一。让我们通过两种极端情况来理解 K 值的作用：

较小的 K 值（例如 k=1 或 k=3）：

模型变得非常敏感，只会关注距离最近的几个点。决策边界会变得非常复杂、支离破碎，紧紧贴合训练数据的形状，甚至会出现许多“孤岛”。这就好比你在观察世界时只带了放大镜，虽然看到了细节，但也容易被噪点误导。这通常被称为过拟合。

较大的 K 值（例如 k=50 或 k=100）：

模型考虑了更多的邻居，对单个数据点的异常值不再敏感。决策边界会变得平滑、简洁，甚至可能趋近于一条直线或平滑的曲线。这就像是把视野拉远，虽然忽略了局部细节，但能更好地把握整体趋势。如果 K 值过大，模型可能会忽略掉局部的重要特征，导致欠拟合。

#### 2. 距离度量的影响

除了 K 值，计算距离的方式也会直接改变边界的形状。这就好比你在城市中导航，走直线（欧几里得距离）和沿着街道方格走（曼哈顿距离）所能到达的区域是不同的。

欧几里得距离：

这是我们最熟悉的距离计算方式。在二维空间中，它倾向于形成圆形或椭圆形的决策边界（围绕中心点）。这意味着“半径”内的所有点都被视为近邻。

曼哈顿距离：

也称为城市街区距离。它计算的是两点在坐标轴上的绝对距离之和。使用这种度量标准，决策边界通常会呈现矩形或阶梯状，且与坐标轴对齐。在某些高维数据集中，曼哈顿距离往往比欧几里得距离更具鲁棒性。

实战演练：可视化不同 K 值下的决策边界

光说不练假把式。让我们通过一个具体的二分类问题，来亲眼看看 K 值的变化是如何重塑决策边界的。我们将使用 Python 的 scikit-learn 库来生成合成数据并绘制边界。

#### 准备工作：生成数据

首先，我们需要一个包含两个特征的数据集，这样方便在二维平面上绘制。我们将生成 200 个样本点。

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_classification
from sklearn.neighbors import KNeighborsClassifier

# 设置中文字体，确保图表中的标签能正常显示（如果环境支持）
plt.rcParams[‘font.sans-serif‘] = [‘SimHei‘, ‘Arial Unicode MS‘]
plt.rcParams[‘axes.unicode_minus‘] = False

# 生成合成数据：2个特征，2个类别，便于可视化
X, y = make_classification(
    n_samples=200, 
    n_features=2, 
    n_informative=2, 
    n_redundant=0, 
    n_clusters_per_class=1, 
    random_state=42
)

#### 核心步骤：绘制决策边界

要绘制决策边界，我们不能只画数据点，而是要对整个特征空间进行“扫描”。我们通过创建一个网格，预测网格中每个点的类别，然后根据结果填充颜色。

# 1. 定义网格边界
x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1
y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1

# 2. 生成网格点矩阵 (步长 0.01)
xx, yy = np.meshgrid(
    np.arange(x_min, x_max, 0.01), 
    np.arange(y_min, y_max, 0.01)
)

# 准备画布
fig, axs = plt.subplots(2, 2, figsize=(14, 12))
plt.subplots_adjust(wspace=0.4, hspace=0.4)

# 我们要测试的 K 值列表
k_values = [1, 5, 15, 50]

count = 0
for ax in axs.flat:
    k = k_values[count]
    
    # 3. 训练模型
    clf = KNeighborsClassifier(n_neighbors=k)
    clf.fit(X, y)
    
    # 4. 预测网格中每个点的类别
    # np.c_ 将切片对象转换为沿第二轴的连接
    Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)

    # 5. 绘制决策区域 (contourf 填充等高线)
    ax.contourf(xx, yy, Z, alpha=0.3, cmap=plt.cm.coolwarm)
    
    # 绘制训练数据点
    ax.scatter(X[:, 0], X[:, 1], c=y, s=20, edgecolor=‘k‘, cmap=plt.cm.coolwarm)
    
    # 设置标题和标签
    ax.set_title(f‘KNN 决策边界: K = {k}‘)
    ax.set_xlabel(‘特征 1‘)
    ax.set_ylabel(‘特征 2‘)
    
    count += 1

plt.show()

#### 代码详解与观察

在这段代码中，我们做了以下几件关键的事：

创建网格 (np.meshgrid)：我们将特征空间切分成无数个微小的方块，每个小方块的边长是 0.01。这就像是我们在一张白纸上打上了极细的网格。
网格预测 (clf.predict)：模型不仅仅是预测训练数据，而是对网格上的每一个点都进行预测。这就得出了整个空间的类别分布。
填充颜色 (contourf)：我们根据预测结果给网格上色。相同颜色的区域代表模型认为属于同一类的区域，两种颜色的交界处就是我们要找的决策边界。

当你运行这段代码时，你会看到非常明显的区别：

当 K=1 时，你会发现图中有很多小的“孤岛”，边界极其曲折，紧紧包裹着每一个点。这是过拟合的典型表现。
当 K=5 时，边界开始变得平滑一些，局部的抖动被磨平了。
当 K=15 或 K=50 时，边界变得非常光滑，甚至可能忽略了某些数据的弯曲结构。这就是欠拟合的迹象。

实战进阶：手动理解加权投票

标准的 KNN 算法通常是“少数服从多数”，不管邻居是远还是近，一票抵一票。但在实际应用中，我们往往希望更近的邻居拥有更大的话语权。这时候，我们可以使用距离加权 KNN。

让我们通过一个简单的代码片段，看看如何开启这个功能，以及它如何影响边界。

# 创建两个模型进行对比
# 标准加权（uniform） vs 距离加权
classifiers = {
    "Standard (K=5, uniform)": KNeighborsClassifier(n_neighbors=5, weights=‘uniform‘),
    "Distance-Weighted (K=5, distance)": KNeighborsClassifier(n_neighbors=5, weights=‘distance‘)
}

plt.figure(figsize=(14, 6))

for i, (name, clf) in enumerate(classifiers.items()):
    plt.subplot(1, 2, i + 1)
    
    # 训练
    clf.fit(X, y)
    
    # 预测网格
    Z = clf.predict(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)
    
    plt.contourf(xx, yy, Z, alpha=0.3, cmap=plt.cm.coolwarm)
    plt.scatter(X[:, 0], X[:, 1], c=y, s=20, edgecolor=‘k‘, cmap=plt.cm.coolwarm)
    plt.title(name)
    plt.xlabel(‘Feature 1‘)
    plt.ylabel(‘Feature 2‘)

plt.tight_layout()
plt.show()

在这个例子中，weights=‘distance‘ 参数告诉算法：邻居越近，投票权重越大。你会发现，距离加权的边界通常在靠近数据点的区域会更精细，而在远离数据点的空白区域，它会更多地参考远处的邻居，有时能更好地处理类别不平衡的情况。

最佳实践与常见陷阱

在结束这篇深入的探讨之前，我想分享一些在实际开发中处理决策边界时的经验之谈。

#### 1. 数据归一化至关重要

你可能已经注意到，我们一直使用的是合成数据。但在处理真实数据（如房价预测、医疗数据）时，特征的量纲往往不同。比如一个特征是“年收入（几万）”，另一个是“年龄（几十）”。如果不进行归一化（StandardScaler 或 MinMaxScaler），大数值的特征会主导距离计算，导致决策边界几乎完全取决于那个特征，而忽略了小数值特征。这会导致边界形状极其怪异且不准确。

#### 2. 距离加权能改善模糊边界

当两个类别的交界处存在大量重叠数据时，简单的 KNN 可能会在边界处产生剧烈的震荡（一点之差，类别全变）。使用距离加权通常能让边界在这个过渡区变得更加平滑和自然。

#### 3. 避免“维度灾难”

KNN 在低维空间表现极佳，但在高维空间（成百上千个特征）中，决策边界往往会失效。因为在高维空间中，所有点之间的距离都趋于相等，导致“最近邻”不再具有统计显著性。如果你必须在高维数据上使用 KNN，建议先使用 PCA 或 t-SNE 等技术进行降维，或者改用其他算法。

总结

通过这篇文章，我们不仅理解了 KNN 决策边界的几何本质，还亲手通过代码看到了参数 K 像画笔一样改变分类区域的形状。我们从 Voronoi 图的微观视角出发，探讨了从过拟合到欠拟合的连续变化，并学习了距离度量与加权投票的影响。

掌握决策边界的可视化技巧，能帮助你直观地诊断模型是“太死板”还是“太随意”。我鼓励你在自己的项目中尝试这些代码，绘制出你的数据在特征空间中的样子。毕竟，一个好的机器学习工程师，不仅要懂算法，更要“看透”数据的形状。

祝你下一次在构建分类器时，能够更有信心地调整那个至关重要的 K 值！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客