在进行研究或分析实验数据时,除了评估统计显著性之外,评估发现的实际重要性或现实影响也是至关重要的。在这种情况下,“效应量”的概念就变得非常相关。通过使用这种标准化的度量指标来描述观察到的效应大小,我们可以量化并讨论研究结果的应用价值。
估算和理解效应量在很大程度上依赖于效应量公式。这些方程旨在浓缩组间差异的大小或变量之间关系的强度和方向。通过测量效应量,我们可以提高研究结果的可复现性,更好地理解发现的重要性,并做出明智的决策。
什么是效应量?
统计学中的“效应量”概念衡量的是两个变量之间关系的程度或强度,或者是两个组别之间的区别。它指示了特定的治疗、干预或因素对预期结果有多大影响。效应量非常有用,因为它使学者和从业者能够理解其发现的实际重要性或现实价值。
什么是效应量公式?
我们使用 Cohen’s d 方法来计算两个变量之间的关联程度:
> Effect Size = (M1 – M2)/SD
>
>
>
> 其中,
>
>
>
> – M1 是第一个总体组的平均值,
> – M2 是第二个总体组的平均值,
> – SD 是标准差。
效应量的解释
根据标准化标准,效应量可以分为三类:小、中、大。根据具体情况和研究课题,对小、中和大效应可能有不同的适用定义。
除了统计显著性之外,效应量还有助于评估结果的实际重要性或价值。结果在统计上显著并不总是意味着它有很大的效应量,反之亦然。因此,在检查数据时,必须同时考虑统计显著性和实际显著性。
效应量的类型
效应量分为很多类型,每种类型的意图都是衡量两个变量之间的关系。最常用的效应量类型包括:
- Cohen‘s d
- Pearson‘s r
- 比值比
- Phi 系数
让我们详细讨论这些类型:
Cohen‘s d
此指标用于测量两个平均值之间的标准化差异。
> Cohen‘s d = M1 – M2 / SD
>
>
>
> 其中,
>
>
>
> – d 是效应量,
> – M1 是第一个总体组的平均值,
> – M2 是第二个总体组的平均值,
> – SD 是标准差。
> – SD = √{(SD12 + SD22) ⁄ 2}
> – 其中 SD1 和 SD2 是第一个和第二个总体组的标准差。
Pearson‘s r
它计算两个变量之间的线性相关强度。
> Pearson‘s r = cov(X,Y)/(SDx × SDy)
>
>
>
> 其中,
>
>
>
> – cov(X,Y) 是 X 和 Y 之间的协方差,
> – \bold{\text{cov(X, Y)} = {\dfrac{\sum{i=i}^{n} (xi-\bar{x})(yi-\bar{Y})}{n-1}}}
> – SDx 是 X 的标准差,
> – SDy 是 Y 的标准差。
> – \bold{\text{SD} = \sqrt{\dfrac{\sum{i=i}^{n} (xi-\bar{x})^2}{n}}}
Odds Ratio (比值比)
这计算事件在一个组与另一个组中发生的可能性,公式如下:
> Odds Ratio = (a/b)/(c/d)
>
>
>
> 其中 a,b,c, 和 d 是 2 × 2 表格中的频数。
Phi Coefficient (Phi 系数)
这衡量两个二元变量之间关系的强度,数学公式如下:
> Phi Coefficient = (ad – bc) / √{(a+b)(c+d)(a+c)(b+d)}
>
>
>
> 其中 a,b,c, 和 d 是 2 × 2 表格中的频数。
效应量公式的应用实例
例 1:一项研究比较了两组学生的考试成绩。A组的平均分是80分,而B组的平均分是85分。计算出的合并标准差为10。请使用 Cohen‘s d 确定效应量。
答案:
> 已知: M1 = 80, M2 = 85, 且 SD = 10
>
>
>
> 使用公式,d = (M1 – M2) / SD
>
>
>
> ⇒ d = (80 – 85) / 10
>
>
>
> ⇒ d = -5 / 10= -0.5
>
>
>
> 在这种情况下,效应量为 -0.5。
例 2:一项研究使用标准化的焦虑量表比较了两组的焦虑水平。X组的平均分为35,而Y组的平均分为40。计算出的合并标准差为6.5。使用 Cohen‘s d 确定效应的大小。
答案:
> 已知: M1 = 35, M2 =