什么是相关性?
相关性 是一种统计工具,它帮助我们要研究两个变量之间的关系。它还有助于我们理解变量的经济行为。然而,相关性并不能告诉我们关于这两个变量之间因果关系的任何信息。我们可以通过三种不同的方法来测量相关性;即,散点图、卡尔·皮尔逊相关系数和斯皮尔曼等级相关系数。
> 根据 L.R. Connor 的观点:
> “如果两个或多个数量同步变动,以至于其中一个的变动往往伴随着其他数量的相应变动,那么它们就是相关的。”
测量两个变量之间相关性的三种不同方法是:
- 散点图
- 卡尔·皮尔逊相关系数
- 斯皮尔曼等级相关系数
1. 散点图
一种通过图形化表示二元分布来确定变量之间相关性质,从而简单且直观地测量相关性的方法,被称为散点图法。这种方法为调查人员/分析师提供了关于两个变量之间关联性质的直观概念。这是研究两个变量之间关系最简单的方法,因为不需要计算任何数值。
#### 如何绘制散点图?
绘制散点图或点图需要以下两个步骤:
- 分别沿 X 轴和 Y 轴绘制给定变量(比如 X 和 Y)的值。
- 用点在图表上显示这些绘制的值。这些点中的每一个都代表一对值。
#### 示例:
借助散点图来表示以下 X 和 Y 变量的值。同时,评论相关的类型和程度。
#### 解决方案:
散点图显示,这些点从图的左下角到右上角呈现上升趋势。简而言之,X 和 Y 变量的值之间存在正相关。
2. 卡尔·皮尔逊相关系数:
1890 年,卡尔·皮尔逊 是第一个给出数学公式来测量两个变量之间关系程度的人。卡尔·皮尔逊相关系数 也被称为积矩相关 或 简单相关系数。这种测量相关系数的方法是最受欢迎的,并且被广泛使用。它用 ‘r‘ 表示,其中 r 是一个纯数,这意味着 r 没有单位。
> 根据卡尔·皮尔逊的说法:
> “相关系数的计算方法是将偏离各自均值的离差乘积之和除以配对数及其标准差。”
$$
Karl\ Pearson‘s\ Coefficient\ of\ Correlation(r)=\frac{Sum\ of\ Products\ of\ Deviations\ from\ their\ respective\ means}{Number\ of\ Pairs\times{Standard\ Deviations\ of\ both\ Series}}
$$
或者
$$
r=\frac{\sum{xy}}{N\times{\sigmax}\times{\sigmay}}
$$
其中,
- N = 观测值的配对数
- x = X 系列偏离均值的离差 ($X-\bar{X}$)
- y = Y 系列偏离均值的离差 ($Y-\bar{Y}$)
- $\sigma_x$ = X 系列的标准差 ($\sqrt{\frac{\sum{x^2}}{N}}$)
- $\sigma_y$ = Y 系列的标准差 ($\sqrt{\frac{\sum{y^2}}{N}}$)
- r = 相关系数
#### 示例:
使用实际均值法,确定以下数据的卡尔·皮尔逊相关系数:
#### 解决方案:
!Coefficient of Correlation Table
$$
\bar{X}=\frac{\sum{X}}{N}=\frac{90}{6}=15
$$
$$
\bar{Y}=\frac{\sum{Y}}{N}=\frac{72}{6}=12
$$
$$
r=\frac{\sum{xy}}{\sqrt{\sum{x^2}\times{\sum{y^2}}}}
$$
∑xy = 84, ∑x² = 70, ∑y² = 104
$$
r=\frac{84}{\sqrt{70\times104}}=\frac{84}{\sqrt{7,280}}=\frac{84}{85.32}=0.98
$$
相关系数 = 0.98
这意味着序列 X 和序列 Y 的值之间存在正相关。
3. 斯皮尔曼等级相关系数:
斯皮尔曼等级相关系数 或 斯皮尔曼等级差法或公式 是一种计算定性变量相关系数的方法,由 Charles Edward Spearman 于 1904 年 开发。