深入理解 Python 中的肯德尔等级相关系数：原理、实现与最佳实践

2026-02-03 12:44:55 0条评论 2次阅读 0人点赞

在数据分析和统计学领域，我们经常面临这样的问题：两个变量之间是否存在某种关联？这种关联的强度又是如何？

通常，我们可以通过相关性检验来回答这个问题。你可能在很多场景下都接触过这个概念，比如我们想知道父亲的身高和儿子的身高之间是否存在遗传关系，或者想了解某只股票的价格波动是否与市场指数的走势有关。

虽然最著名的皮尔逊相关系数能够很好地衡量线性关系，但在处理非线性数据或非正态分布数据时，它往往会力不从心。这时候，我们就需要引入更稳健的非参数相关性分析方法。在本文中，我们将深入探讨其中的一种强大工具——肯德尔等级相关系数，并通过实际的 Python 代码示例，带你一步步掌握它的计算原理与应用场景。

0.1 相关性分析：参数与非参数方法的选择
0.2 肯德尔等级相关系数的核心原理
0.3 实战演练：手动计算过程
0.4 Python 实战：使用 Scipy 计算肯德尔系数

1 创建模拟数据集
2 计算相关性
3 逻辑判断：满意度高是否真的导致销量高？
- 3.1 总结与后续步骤

肯德尔等级相关系数的核心原理

肯德尔相关系数通过评估观测值对之间的“一致性”来衡量相关性。让我们来拆解一下它的核心逻辑。

数学公式

肯德尔系数（通常用希腊字母 $\tau$ 表示）的计算公式如下：

$$ \tau = \frac{\text{一致对数量} – \text{不一致对数量}}{\frac{n(n-1)}{2}} $$

这里有几个关键概念需要我们理解：

一致对：假设我们有两个观测点 $(x1, y1)$ 和 $(x2, y2)$。如果满足以下条件之一，我们就称它们为“一致对”：

– $x1 > x2$ 且 $y1 > y2$ （两对数据都变小了）

– $x1 < x2$ 且 $y1 < y2$ （两对数据都变大了）

简单来说，就是两个变量的变化方向相同。

不一致对：如果满足以下条件之一，则称它们为“不一致对”或“ Discordant pair”：

– $x1 > x2$ 且 $y1 < y2$ （x 变大，y 变小）

– $x1 < x2$ 且 $y1 > y2$ （x 变小，y 变大）

也就是说，两个变量的变化方向相反。

特殊处理（平局）：如果 $x1 = x2$ 或 $y1 = y2$，则无法判断变化方向。这些配对既不算一致对，也不算不一致对，在计算中通常会被忽略（或者在特定变体中进行修正）。

$n$：样本总数。

结果解读

肯德尔系数的取值范围在 -1 到 +1 之间：

+1：完全正相关。所有观测对都是一致对，说明两个变量的排名完全一致。
-1：完全负相关。所有观测对都是不一致对，说明一个变量增加时另一个变量严格减少。
0：不相关。一致对和不一致对的数量大致相等，说明两个变量之间没有明显的单调关系。

实战演练：手动计算过程

为了让你彻底理解这个公式是如何工作的，让我们通过一个具体的例子来手动计算一遍。

场景：假设我们有两位食品专家，他们对 7 种不同的食品项目进行了排名。我们想知道这两位专家的评审口味是否一致。
数据如下：

项目

专家 1 排名

专家 2 排名 :—

:—

:— 1

1 2

3 3

6 4

2 5

7 6

4 7

步骤 1：确定一致对与不一致对

我们需要将数据中的所有两两组合进行比较。总共有 $n(n-1)/2 = 7(6)/2 = 21$ 对需要比较。

让我们看几个具体的例子：

比较项目 1 和项目 2：

– 专家 1: $x1=1, x2=2$ ($x1 < x2$)

– 专家 2: $y1=1, y2=3$ ($y1 < y2$)

– 结论：$x$ 和 $y$ 都增加了，这是一对 一致对。

比较项目 2 和项目 4：

– 专家 1: $x2=2, x4=4$ ($x2 < x4$)

– 专家 2: $y2=3, y4=2$ ($y2 > y4$)

– 结论：$x$ 增加了，但 $y$ 减少了，这是一对 不一致对。

通过系统地比较每一对项目，我们可以汇总出如下表格（C 代表一致，D 代表不一致）：

—

–

-### 步骤 2：计算结果

现在，我们只需要统计表格中的 C 和 D 数量：

一致对数量：15
不一致对数量：6
总对数：21

套用公式：

$$ \tau = \frac{15 – 6}{21} = \frac{9}{21} \approx 0.42857 $$

结论：

我们得到的肯德尔系数约为 0.42857。这是一个正值，说明两位专家之间存在一定程度的一致性（虽然不是完全的强相关，但也远非随机）。如果这个结果是负值，比如 -0.8，那就意味着专家 1 排名越高的项目，专家 2 反而越讨厌，两人观点完全相反。

Python 实战：使用 Scipy 计算肯德尔系数

在现代开发中，我们当然不需要手动去数表格。Python 的 INLINECODE4595b802 库为我们提供了非常高效的计算函数 INLINECODEda4ccac4。

基础示例：复现上述计算

让我们用代码来实现上面的专家评分例子。scipy.stats.kendalltau 函数会返回两个值：相关系数和 p 值。p 值用于检验结果的显著性（即相关性是否由随机偶然产生）。

# 导入所需的库
from scipy.stats import kendalltau

# 定义数据：使用我们在上面例子中用到的排名数据
expert_1 = [1, 2, 3, 4, 5, 6, 7]
expert_2 = [1, 3, 6, 2, 7, 4, 5]

# 计算 Kendall Rank 相关系数
# kendalltau 返回一个元组: (相关系数, p-value)
corr, p_value = kendalltau(expert_1, expert_2)

# 打印结果，保留5位小数
print(f‘肯德尔等级相关系数: {corr:.5f}‘)
print(f‘P值 (显著性检验): {p_value:.5f}‘)

# 结果解读
if p_value < 0.05:
    print('结论: 相关性在统计上是显著的 (p < 0.05)')
else:
    print('结论: 相关性可能不显著')

输出结果：

肯德尔等级相关系数: 0.42857
P值 (显著性检验): 0.17504
结论: 相关性可能不显著
``

> **注意**：虽然系数是 0.42，但 p 值约为 0.175。这意味着由于样本量太小（只有7个数据点），虽然观察到了正相关性，但我们在统计上不能完全排除这是随机造成的。这就引出了数据分析中的一个重要原则：**不仅要看效应量（相关系数），还要看显著性。**

### 进阶示例：处理大数据集与 Pandas 结合

在实际工作中，我们通常处理的是存储在 DataFrame 中的结构化数据。让我们看一个更接近真实业务的例子。

假设我们有一份电商数据，记录了 10 件商品的“用户满意度排名”和“实际销量排名”。我们要分析满意度是否真的驱动了销量。

python

import pandas as pd

from scipy.stats import kendalltau

创建模拟数据集

data = {

‘product_id‘: range(1, 11),

‘satisfaction_rank‘: [1, 5, 2, 8, 10, 3, 6, 4, 9, 7], # 满意度排名 (1最好)

‘sales_rank‘: [2, 6, 3, 9, 10, 4, 7, 5, 8, 1] # 销量排名 (1最高)

}

df = pd.DataFrame(data)

计算相关性

corr, pvalue = kendalltau(df[‘satisfactionrank‘], df[‘sales_rank‘])

print("— 电商数据分析报告 —")

print(f"肯德尔相关系数: {corr:.4f}")

print(f"显著性 P值: {p_value:.4f}")

逻辑判断：满意度高是否真的导致销量高？

if corr > 0.3 and p_value < 0.05:

print("

洞察: 用户满意度与销量之间存在显著的正相关关系。")

print("建议: 继续提升产品质量以提高满意度，从而带动销量。")

elif corr < 0:

print("

洞察: 令人意外！满意度高的商品销量反而低 (负相关)。")

print("建议: 检查是否存在价格过高或库存不足等阻碍转化的因素。")

else:

print("

洞察: 满意度与销量之间没有明显的线性关系。")

“


**代码解析**：

在这个例子中，我们使用了 Pandas 来组织数据，这使得数据管理变得非常容易。我们将计算结果与业务逻辑结合，输出了简单的“洞察”和“建议”。这展示了数据分析不仅仅是输出一个数字，更重要的是解释这个数字对业务意味着什么。
## 深入探讨：最佳实践与常见错误
作为一个经验丰富的开发者，我想在这里分享一些在使用肯德尔系数时的“坑”和最佳实践。
### 1. 样本量的重要性
你可能在上面的第一个例子中注意到了，相关系数 0.42 很高，但 p 值却不显著。这是因为 **肯德尔系数在小样本下非常敏感**。如果你的样本量 $n$ 小于 10，除非相关性极强（接近 1 或 -1），否则很难通过显著性检验。
**建议**：在处理小样本数据（如问卷调查回复少于 20 份）时，请务必谨慎解读 p 值，或者考虑结合定性分析。对于大数据集，肯德尔系数的计算复杂度较高（$O(n^2)$），如果数据量达到数万行，计算可能会变慢，此时可以考虑斯皮尔曼系数作为替代。
### 2. 处理“平局”

在实际数据中，平局是非常常见的。例如，两个学生的成绩并列第 5 名，或者两个产品的价格完全相同。标准版的肯德尔系数（kendalltau` 中的默认行为，通常称为 Tau-b）在分母上对平局进行了修正，使其能够更准确地处理含有大量重复值的数据。

如果你发现数据中充满了重复值（例如等级评价只有 1-5 分，但样本有 1000 人），肯德尔系数依然适用，但要注意它可能会低估真实的关联强度。

3. 何时选择 Kendall vs. Spearman vs. Pearson

这是面试和实际工作中常被问到的问题。我们的选择策略如下：

首选 Pearson：当数据是连续的，且服从正态分布，并且你关注的是线性关系时。
首选 Kendall：当数据是序数（即有等级之分，但等级间的距离不一定相等，如“好/中/差”），或者样本量较小，或者数据中包含异常值时。Kendall 的统计功效通常比 Spearman 更好。
首选 Spearman：当你处理单调关系（非线性但方向一致），且数据量较大不担心计算速度时。

总结与后续步骤

在这篇文章中，我们深入探讨了肯德尔等级相关系数这一强大的统计工具。

我们首先区分了参数与非参数检验，明确了肯德尔系数在处理排名数据和异常值方面的优势。接着，我们通过详细的数学公式和手动计算示例，揭示了“一致对”与“不一致对”的计数逻辑。最后，我们利用 Python 和 Scipy 库实现了自动化计算，并讨论了如何处理真实业务场景中的数据分析。

作为开发者，掌握这项技能能让你在处理 A/B 测试结果、推荐系统排序评估或用户行为分析时更加得心应手。

接下来，你可以尝试以下步骤来巩固你的知识：

动手实践：找一份公开的数据集（如 Kaggle 上的电影评分数据），尝试计算“评分”与“票房”之间的肯德尔系数。
对比实验：对同一组数据分别计算 Pearson、Spearman 和 Kendall 系数，观察结果有何差异，并思考为什么。
深入研究 p 值：学习假设检验的基础，理解为什么统计学显著性不等于实际重要性。

希望这篇文章能帮助你更好地理解和使用 Python 进行相关性分析！如果你有任何问题或心得，欢迎在评论区交流。

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客

深入理解 Python 中的肯德尔等级相关系数：原理、实现与最佳实践

相关性分析：参数与非参数方法的选择

参数相关性：皮尔逊相关系数 (Pearson r)

非参数相关性：肯德尔和斯皮尔曼

肯德尔等级相关系数的核心原理

数学公式

结果解读

实战演练：手动计算过程

步骤 1：确定一致对与不一致对

Python 实战：使用 Scipy 计算肯德尔系数

基础示例：复现上述计算

创建模拟数据集

计算相关性

逻辑判断：满意度高是否真的导致销量高？

3. 何时选择 Kendall vs. Spearman vs. Pearson

总结与后续步骤

相关文章美国1G带宽/1T流量高速vps $17.99/年

深入理解 Python 中的肯德尔等级相关系数：原理、实现与最佳实践

相关性分析：参数与非参数方法的选择

参数相关性：皮尔逊相关系数 (Pearson r)

非参数相关性：肯德尔 和 斯皮尔曼

肯德尔等级相关系数的核心原理

数学公式

结果解读

实战演练：手动计算过程

步骤 1：确定一致对与不一致对

Python 实战：使用 Scipy 计算肯德尔系数

基础示例：复现上述计算

创建模拟数据集

计算相关性

逻辑判断：满意度高是否真的导致销量高？

3. 何时选择 Kendall vs. Spearman vs. Pearson

总结与后续步骤

相关文章美国1G带宽/1T流量高速vps $17.99/年

非参数相关性：肯德尔和斯皮尔曼