如何利用 Excel 制作专业的森林图

作为一名数据分析师或研究人员,我们经常需要在没有专业统计软件(如 Stata 或 R)的情况下,快速生成可视化的统计分析结果。森林图作为一种在荟萃分析和医学研究中广泛使用的图表类型,能够在一个视图中展示多个研究的效应值及其置信区间。然而,许多刚接触 Excel 的朋友可能会发现,Excel 的默认图表库中并没有直接提供“森林图”这一选项。别担心,在这篇文章中,我们将像专业图表制作高手一样,利用 Excel 内置的图表组合功能,一步步构建出专业、美观且准确的森林图。

通过这篇文章,你将学会如何处理原始数据,如何巧妙地组合“条形图”与“散点图”,以及如何通过数学计算添加误差线。让我们一起深入探索这个看似复杂但实际上逻辑非常清晰的过程。

什么是森林图?为什么要使用它?

在开始操作之前,让我们先明确一下什么是森林图。简单来说,森林图是一种用图形展示定量数据汇总结果的统计图。它通常用于荟萃分析中,可以让我们一目了然地看到:

  • 单个研究的效应量:通常用方块或圆点表示。
  • 置信区间:通常是 95% 置信区间,表示结果的可信范围,用线条表示。
  • 综合效应量:通常位于图表的最底部,代表所有研究的综合结果。

Excel 没有一键生成森林图的按钮,但这恰恰给了我们定制化的空间。我们将利用 Excel 强大的图表引擎,手动搭建这个可视化模型。这不仅能让你的图表更加自由,还能让你深刻理解森林图背后的数学逻辑。

第一步:数据的准备与规范化

任何优秀的图表都始于整洁的数据。在 Excel 中制作森林图,我们不能直接把原始数据扔进去,而是需要进行一些预处理。

让我们先来看看数据的理想格式。假设我们有一组关于治疗效果的研究数据,包含以下几列:

  • Study (研究名称):Y 轴的分类标签。
  • Odds Ratio (比值比/效应量):这是我们要展示的核心数值,X 轴的位置。
  • Lower 95% CI (95%置信区间下限):效应量的最低估值。
  • Upper 95% CI (95%置信区间上限):效应量的最高估值。

实战示例代码(Excel 公式逻辑):

在 Excel 表格中,如果你的 INLINECODE7ec106de 在 B 列,INLINECODE1ba80c8e 在 C 列,Upper CI 在 D 列,我们需要手动计算误差线的长度,因为 Excel 的散点图误差线功能需要的是“差值”,而不是绝对值。

我们可以在 E 列和 F 列添加辅助列:

  • Error Bar Lower (误差线负值长度):计算公式为 =B2 - C2(效应值 – 下限)。
  • Error Bar Upper (误差线正值长度):计算公式为 =D2 - B2(上限 – 效应值)。

这是初学者最容易出错的地方。请确保你的计算逻辑正确:误差线是从中心点向两边延伸的,所以我们需要计算的是延伸的长度,而不是坐标轴上的绝对位置。

‘ 伪代码示例:计算下限误差线长度
= [Odds_Ratio_Cell] - [Lower_CI_Cell]

‘ 伪代码示例:计算上限误差线长度
= [Upper_CI_Cell] - [Odds_Ratio_Cell]

第二步:创建基础坐标系(条形图的妙用)

数据准备好后,我们开始构建图表骨架。森林图在 Y 轴上是分类数据(研究名称),X 轴是数值。在 Excel 中,最适合作为这种载体的是“簇状条形图”

操作步骤:

  • 选中数据:首先,选中 INLINECODE122cdd19 列(A列)和 INLINECODE63b1287c 列(B列)。这里有一个小技巧:只要选中这两列即可,其他的辅助数据我们稍后再加,这样图表会比较干净。
  • 插入图表:点击顶部菜单栏的 “插入” 选项卡,找到图表区域。点击 “二维簇状条形图”
  • 生成基础图:此时,你会看到一个简单的水平条形图。虽然它现在看起来还很普通,但这为我们的散点图提供了完美的 Y 轴坐标系统。因为条形图会自动将研究名称排列在 Y 轴上,这正是我们需要的。

> 专业见解:为什么不直接插入散点图?因为 Excel 的普通散点图默认 X 轴和 Y 轴都是数值。如果直接用散点图,我们需要手动设置 Y 轴的刻度对应每一个研究名称,这非常繁琐。利用条形图作为“宿主”,可以借用它的分类轴功能。

第三步:添加效应量点(散点图的引入)

现在,我们要把表示具体效应值的“点”加到图表上。我们将使用“散点图”来实现这一目标。

操作步骤:

  • 准备辅助列:为了将散点图精确定位在每个条形的中间,我们需要创建一个名为 Points (点) 的辅助列。逻辑很简单,如果我们有 8 个研究,我们可以给它们编号 1 到 8。这个编号决定了点在 Y 轴上的垂直位置。
Study

Odds Ratio

Points (Y轴坐标) :—

:—

:— Study A

1.5

1 Study B

0.8

2 …

  • 添加系列:右键单击图表中的任意位置(绘图区),在弹出的菜单中选择 “选择数据”
  • 新建系列:在弹出的对话框中,点击左侧的 “添加” 按钮。
  • 设置系列值

* 系列名称:可以留空,或者命名为“Effect Size”。

* 系列值:这里可以先随意选一列数值(比如直接选 Odds Ratio 列),或者直接点击确定。因为我们稍后还要修改它。

注意:点击确定后,你可能看不到明显的变化,或者图表上多了一个不太显眼的条形。这是正常的,我们还没有把它变成散点图。

第四步:更改图表类型与坐标映射

这是整个过程中最关键的一步:组合图表。我们需要将刚才添加的系列从“条形”变成“散点”,并将其映射到次坐标轴或正确的坐标轴上。

操作步骤:

  • 切换图表类型:右键单击图表中新出现的那个不太明显的系列(或者通过顶部菜单栏的 “图表设计” 选项卡),选择 “更改图表类型”
  • 组合图表设置:在弹出的窗口底部,找到 “组合图” 选项。
  • 设置系列类型

* 将原始的系列(比如“Odds Ratio”)保持为 “簇状条形图”

* 将我们新添加的系列(Series2)更改为 “散点图”

* 重要:务必勾选“次坐标轴”选项,或者至少确保散点图被正确识别。在这个特定场景下,勾选“次坐标轴”有时有助于避免坐标轴冲突,但在制作森林图时,我们稍后会手动对齐它们,所以现在先点击 “确定”

此时,你的图表上可能会出现一个孤零零的散点,位置可能不对,别急,我们接下来修复它。

第五步:精确编辑散点图数据

现在,我们需要告诉 Excel,刚才那个散点图的 X 值是什么,Y 值是什么。

操作步骤:

  • 再次右键单击绘图区,选择 “选择数据”
  • 在左侧列表中选中我们的新系列,点击 “编辑”
  • 设置 X 轴系列值:选中 Odds Ratio(比值比)这一列数据。这决定了点在水平方向的位置。
  • 设置 Y 轴系列值:选中我们之前创建的 Points (点) 辅助列(即 1, 2, 3…)。这决定了点在垂直方向的位置。
  • 点击确定。现在,你应该看到散点图点已经出现在了图表中,并且与条形图的研究名称相对应了。

> 常见错误与解决方案:如果你的点跑到了图表外面,或者没有对齐研究名称,这通常是因为 Y 轴的边界设置问题。请双击左侧的 Y 轴(分类轴),查看坐标轴选项。我们需要让散点图的 Y 轴刻度与分类轴重合。在默认的条形图中,类别通常位于刻度线之间(例如 0.5, 1.5)。为了简单对齐,我们通常将辅助列设为 1, 2, 3,并调整坐标轴边界为 0 到 N+1。

第六步:隐藏辅助条形图

既然我们已经有了散点图来表示数据,那个原本用来占位的条形图就可以光荣退休了。但我们不能直接删除它,因为一旦删除,关联的 Y 轴标签也会消失。

操作步骤:

  • 无填充:点击图表中的条形图部分,右键选择 “设置数据系列格式”
  • 在右侧弹出的格式面板中,找到 “填充” 选项,选择 “无填充”
  • 此时,条形图变透明了,但研究名称(Y 轴标签)依然保留。

第七步:调整坐标轴与布局

为了让图表看起来更像一个真正的森林图,我们需要进行一些清理工作。

  • 设置 Y 轴边界:双击右侧的 Y 轴(如果散点图在次坐标轴)或者左侧 Y 轴。将 “边界” 的最小值设置为 0,最大值设置为研究总数加一(例如有 8 个研究,就设为 9 或 8)。这样可以确保散点位于标签的中心位置。
  • 删除多余的 Y 轴:如果你在右侧看到了次坐标轴的数值(1, 2, 3…),请选中它并按 Delete 键删除。我们只需要左侧的研究名称。

第八步:添加误差线(点睛之笔)

森林图的灵魂在于那条代表置信区间的细线。

操作步骤:

  • 选中散点系列:点击图表上的散点图点,此时所有点都应该被选中。
  • 添加误差线:点击图表右上角的 “+” 号(图表元素),勾选 “误差线”。或者通过菜单栏的 “图表设计” -> “添加图表元素” -> “误差线” -> “标准误差” 来添加。
  • 自定义误差值:默认的误差线是错误的,我们需要手动输入。

* 双击刚才添加的误差线,打开格式设置面板。

* 在误差线选项中,找到 “误差量” 区域,选择 “自定义”,然后点击 “指定值”

* 正误差值:选中我们之前计算好的 Error Bar Upper 列数据(上限 – 效应值)。

* 负误差值:选中 Error Bar Lower 列数据(效应值 – 下限)。

* 点击确定。

现在,你应该看到每个点两边都延伸出了漂亮的线条,这就是置信区间!

第九步:美化与格式调整

最后,让我们把图表做得更专业。

  • 添加参考线:森林图通常在 X=1(对于比值比)或 X=0(对于均值差)处有一条垂直的无效线。我们可以通过插入 -> 形状 -> 直线来手动添加,并将其对齐到 X 轴的相应刻度。
  • 调整点的大小:选中散点图,在设置面板中调整 “大小”。通常森林图的点比较小,显得精致。
  • 优化标签:确保 Y 轴的研究名称字体清晰,不要被遮挡。

总结

虽然 Excel 没有直接提供森林图功能,但通过组合使用条形图和散点图,并配合自定义误差线,我们完全可以达到甚至超越专业统计软件的图表效果。这不仅展示了 Excel 的灵活性,也帮助我们更好地理解了图表的构成要素。

你现在掌握的不仅仅是制作一张图表的方法,更是一种“组合图表”的思维方式。下次遇到 Excel 默认图表库里没有的复杂图形时,不妨试着拆解它:它是由什么基本图形组成的?能不能用“条形图+散点图”或者“折线图+面积图”来实现?希望这篇教程能激发你的创造力,让你的数据分析报告更加出彩。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。如需转载,请注明文章出处豆丁博客和来源网址。https://shluqu.cn/39086.html
点赞
0.00 平均评分 (0% 分数) - 0