R语言进阶：深入解析三种计算F1分数的实用方法

2026-02-04 08:55:03 0条评论 2次阅读 0人点赞

在机器学习和数据科学的项目中，我们经常需要构建分类模型来预测业务结果。然而，仅仅查看模型的准确率往往是不够的，尤其是在处理类别不平衡的数据集时。这时，F1分数（F1 Score）就成为了我们衡量模型性能的关键指标。

在这篇文章中，我们将深入探讨如何在 R 语言中利用多种不同的方式来计算 F1 分数。我们将从基础的数学概念出发，逐步讲解如何使用 INLINECODEdc26c211 和 INLINECODE771544a7 等主流 R 语言包，最后甚至教你如何从零开始手动实现这一指标。无论你是数据分析的初学者，还是希望优化代码性能的资深开发者，这篇文章都能为你提供实用的见解和技巧。

什么是 F1 分数？为什么它如此重要？

F分数（F-score）或 F度量（F-measure）是用于衡量分类模型测试准确性的一项重要指标。它是精确率和召回率的调和平均值。为了让你更好地理解，我们需要先明确两个核心概念：

精确率：在模型预测为“阳性”的所有样本中，真正为“阳性”的比例是多少？换句话说，就是“模型找出来的准不准”。

* 公式：TP / (TP + FP)

召回率：在所有实际为“阳性”的样本中，模型成功识别出了多少？换句话说，就是“模型有没有漏掉”。

* 公式：TP / (TP + FN)

(注：TP代表真正例，FP代表假正例，FN代表假反例)

F1 分数的核心思想在于，它同时考虑了精确率和召回率，只有在两者都较高时，F1 分数才会高。这使得它成为评估模型稳健性的首选指标。

!image

方法一：使用 MLmetrics 包快速计算

对于想要快速解决问题的开发者来说，使用现成的包是最好的选择。INLINECODE6251e12b 包是一个专门用于评估机器学习性能的工具集，它包含了我们需要的 INLINECODE5879fe44 函数。

#### 1.1 准备工作

在这种计算方法中，我们需要先在 R 控制台中安装并导入该包。让我们来看看具体的代码实现：

# 安装 MLmetrics 包（如果尚未安装）
install.packages("MLmetrics")

# 导入库
library(MLmetrics)

#### 1.2 核心函数解析

F1_Score() 函数

> 语法： F1_Score(y_true, y_pred, positive = NULL)

> 参数详解：

> – y_true：基础真值的向量，即你的测试集标签（例如：0 和 1，或者 "Yes" 和 "No"）。

> – y_pred：你的模型预测出来的标签向量。

> – positive：这是一个可选参数，用于指定哪个因子水平代表“阳性”结果。这对于二分类问题尤其重要。

#### 1.3 实战演练：基础二分类案例

在这个示例中，我们模拟了一个简单的场景：创建两个包含 10 个数据点的向量，一个包含实际值，另一个包含预测值。假设我们的模型并不完美，出现了一些预测错误，让我们看看 F1 分数如何反映这一点。

# 引入 MLmetrics 库
library(MLmetrics)

# 1. 创建模拟数据
# 实际值：包含数字 1 到 10，这里我们将大于5的视为正类（仅作示例说明）
actual <- c(1, 2, 3, 1, 5, 6, 7, 8, 9, 10)
# 预测值：模型做了一些错误的预测（例如把第4个预测为4，把第3个预测为3）
predicted <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)

# 2. 计算 F1 分数
# 注意：MLmetrics 默认处理的是因子或数值标签
# 在这个特定数值案例中，函数会计算全局匹配度，但在分类问题中通常用于 0/1 或因子
score <- F1_Score(predicted, actual)

print(paste("当前的 F1 分数是:", round(score, 4)))

输出结果：

[1] 0.6666667

#### 1.4 进阶场景：处理多分类与标签不一致

在实际工作中，你可能会遇到标签是字符串的情况，比如“Spam”和“Ham”。INLINECODEafc4fd4e 非常智能，可以处理这种情况。我们可以通过 INLINECODE34bd9963 参数明确告诉函数哪一个是正类。

# 场景：垃圾邮件分类
actual_class <- factor(c("Spam", "Ham", "Spam", "Ham", "Spam"))
predicted_class <- factor(c("Spam", "Ham", "Ham", "Ham", "Spam"))

# 计算 F1 分数，指定 "Spam" 为正类
f1_result <- F1_Score(actual_class, predicted_class, positive = "Spam")

print(paste("垃圾邮件检测的 F1 分数:", f1_result))

这种方法的优势在于代码极其简洁，非常适合在数据探索阶段快速验证模型表现。

—

方法二：利用 caret 包进行全面诊断

如果你不仅仅想要一个 F1 分数，而是想要看一眼整个模型的“体检报告”，那么 caret 包（Classification and Regression Training）是你的不二之选。它是 R 语言中机器学习领域的瑞士军刀。

#### 2.1 环境配置

让我们首先安装并加载这个强大的包：

install.packages("caret")
library(caret)

#### 2.2 深入理解 confusionMatrix()

confusionMatrix() 函数：这个函数不仅计算 F1 分数，还会生成混淆矩阵，并计算敏感度、特异度等一系列统计指标。

> 语法： confusionMatrix(data, reference, positive = NULL, mode = "sens_spec", ...)

> 关键参数：

> – data：预测类别的因子向量。

> – reference：实际真值的因子向量。

> – positive：指定正类标签（必须与因子水平一致）。

> – mode：这非常重要！默认通常是 "sensspec"，但为了看到 F1 分数，我们通常设置为 INLINECODE79361666，以确保计算所有可能的指标。

#### 2.3 实战演练：构建混淆矩阵

在这个示例中，我们将模拟一个稍微复杂一点的数据集。请注意，INLINECODEdf7142dd 的 INLINECODEf8c119a2 对输入数据有严格要求：INLINECODE48baf8a9 和 INLINECODE2031d4bf 必须是因子，且必须具有相同的水平。

# 引入 caret 库
library(caret)

# 1. 准备数据
# 我们创建一个包含40个样本的模拟数据集
actual <- factor(rep(c("Yes", "No"), times = c(16, 24)))
predicted <- factor(rep(c("Yes", "No", "Yes", "No"), times = c(12, 4, 7, 17)))

# 检查数据结构，确保它们是因子
str(actual)
str(predicted)

# 2. 生成混淆矩阵并获取指标
# 我们设置 mode = "everything" 以获取包括 F1 在内的所有统计量
# 设置 positive = "Yes" 来指定我们要关注的目标类
cm <- confusionMatrix(predicted, actual, 
                      mode = "everything", 
                      positive = "Yes")

# 3. 打印结果
print(cm)

输出结果：

运行上述代码后，R 控制台会输出详细的统计报告。让我们重点解读其中关于 F1 分数的部分：

Confusion Matrix and Statistics
          Reference
Prediction Yes No
       Yes  12  7
       No    4 17
                                          
               Accuracy : 0.725           
                 ...略去部分输出...
              Precision : 0.6316          
                 Recall : 0.7500          
                     F1 : 0.6857          
       ‘Positive‘ Class : Yes

#### 2.4 提取特定指标

有时我们只需要 F1 分数用于自动化报告或循环计算，而不想打印一大堆文字。我们可以像这样从结果对象中提取它：

# 从混淆矩阵结果中提取 F1 分数
my_f1 <- cm$byClass["F1"]

print(paste("从 Caret 中提取的 F1 分数:", round(my_f1, 4)))

这种方法非常适合模型评估阶段，能让你对模型的优缺点一目了然。

—

方法三：手动计算 F1 分数（完全掌控）

作为开发者，了解底层原理总是有益的。如果不想依赖任何第三方包，或者你需要根据自己的特殊公式修改计算逻辑，手动计算是最好的方式。这也能帮你更好地理解 F1 的数学含义。

#### 3.1 手动计算逻辑

我们可以分步计算：

计算 TP, FP, TN, FN。
根据 Precision = TP / (TP + FP) 计算精确率。
根据 Recall = TP / (TP + FN) 计算召回率。
根据 F1 = 2 (Precision Recall) / (Precision + Recall) 计算最终得分。

#### 3.2 实现代码

让我们写一个自定义函数来实现这个过程。

# 定义一个计算 F1 分数的自定义函数
calculate_f1_manual <- function(actual, predicted, positive_label = 1) {
  
  # 1. 计算混淆矩阵的各个组成部分
  # 真阳性 (True Positives): 实际是正类，预测也是正类
  TP <- sum(actual == positive_label & predicted == positive_label)
  
  # 假阳性: 实际是负类，但预测成了正类
  FP <- sum(actual != positive_label & predicted == positive_label)
  
  # 假阴性: 实际是正类，但预测成了负类
  FN <- sum(actual == positive_label & predicted != positive_label)
  
  # 2. 计算精确率和召回率
  # 注意：防止除以0的情况
  precision <- ifelse((TP + FP) == 0, 0, TP / (TP + FP))
  recall <- ifelse((TP + FN) == 0, 0, TP / (TP + FN))
  
  # 3. 计算 F1 分数
  # F1 是精确率和召回率的调和平均数
  f1_score <- ifelse((precision + recall) == 0, 0, 
                     2 * (precision * recall) / (precision + recall))
  
  # 返回结果列表
  return(list(
    Precision = precision,
    Recall = recall,
    F1_Score = f1_score
  ))
}

# 测试我们的自定义函数
y_true <- c(1, 1, 0, 1, 0, 1, 0, 0)
y_pred <- c(1, 0, 0, 1, 0, 0, 1, 0)

results <- calculate_f1_manual(y_true, y_pred, positive_label = 1)

print(paste("手动计算的精确率:", results$Precision))
print(paste("手动计算的召回率:", results$Recall))
print(paste("手动计算的 F1 分数:", results$F1_Score))

通过这种方式，你可以完全掌控计算过程，甚至可以针对不同类别的权重进行调整，这在处理多分类问题的宏观平均 F1 计算时非常有用。

总结与最佳实践

在这篇文章中，我们探讨了三种在 R 语言中计算 F1 分数的方法：

使用 MLmetrics：适合快速、直接的指标计算，代码量最少。
使用 caret：适合全面的模型评估，不仅能得到 F1，还能得到混淆矩阵和其他统计量，是我们最推荐的日常工作流方法。
手动计算：适合理解底层原理或进行高度定制的评估。

给开发者的建议：

在进行数据分割时，请务必确保你的训练集和测试集是独立的。F1 分数是一个基于测试集的评估指标，如果你在训练集上计算 F1，可能会导致过拟合的假象。此外，注意检查你的数据标签是否为因子类型，这是使用 caret 包时最容易遇到的错误。

希望这篇指南能帮助你在 R 项目的数据分析流程中更加得心应手！如果你在实践过程中遇到数据格式不匹配的问题，不妨多检查一下 str() 函数的输出结果，确保数据类型的一致性。

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客