什么是 Karl Pearson 相关系数?
1890年,Karl Pearson 成为第一个给出数学公式来衡量两个变量之间关系程度的人。Karl Pearson 相关系数也被称为 积矩相关系数 或 简单相关系数。这种测量相关系数的方法最为流行,并且被广泛使用。它用 ‘r‘ 表示,其中 r 是一个纯数字,这意味着 r 没有单位。
> 根据 Karl Pearson 的说法,“相关系数是通过将偏离各自均值的偏差乘积之和除以配对数及其标准差计算得出的。”
目录
- Karl Pearson 相关系数的公式
- 计算 Karl Pearson 相关系数的方法
- 1. 实际均值法
- 2. 直接法
- 3. 简捷法/假定均值法
- 4. 步长偏差法
- 尺度和原点的变换
Karl Pearson 相关系数的公式
$$Karl\ Pearson‘s\ Coefficient\ of\ Correlation(r)=\frac{Sum\ of\ Products\ of\ Deviations\ from\ their\ respective\ means}{Number\ of\ Pairs\times{Standard\ Deviations\ of\ both\ Series}}$$
或者
$$r=\frac{\sum{xy}}{N\times{\sigmax}\times{\sigmay}}$$
其中,
- N = 观测值的配对数
- x = X 系列偏离均值的偏差 $(X-\bar{X})$
- y = Y 系列偏离均值的偏差 $(Y-\bar{Y})$
- $\sigma_x$ = X 系列的标准差 $(\sqrt{\frac{\sum{x^2}}{N}})$
- $\sigma_y$ = Y 系列的标准差 $(\sqrt{\frac{\sum{y^2}}{N}})$
- r = 相关系数
计算 Karl Pearson 相关系数的方法
- 实际均值法
- 直接法
- 简捷法/假定均值法/间接法
- 步长偏差法
#### 1. 实际均值法
使用实际均值法计算相关系数的步骤如下:
- 第一步是计算给定两个系列(比如 X 和 Y)的平均值。
- 现在,取 X 系列相对于 $\bar{X}$ 的偏差,并将偏差表示为 x。
- 对 x 的偏差进行平方并求和;即,$\sum{x^2}$。
- 取 Y 系列相对于 $\bar{Y}$ 的偏差,并将偏差表示为 y。
- 对 y 的偏差进行平方并求和;即,$\sum{y^2}$。
- 将系列 X 和 Y 各自的偏差相乘并求和;即,$\sum{xy}$。
- 现在,使用以下公式来确定相关系数:
$$r=\frac{\sum{xy}}{\sqrt{\sum{x^2}\times{\sum{y^2}}}}$$
#### 示例:
使用实际均值法确定以下数据的相关系数:
!数据表
#### 解答:
!相关系数
$$\bar{X}=\frac{\sum{X}}{N}=\frac{168}{7}=24$$
$$\bar{Y}=\frac{\sum{Y}}{N}=\frac{105}{7}=15$$
$$r=\frac{\sum{xy}}{\sqrt{\sum{x^2}\times{\sum{y^2}}}}$$
$\sum{xy} = 336$, $\sum{x^2} = 448$, $\sum{y^2} = 252$
$$r=\frac{336}{\sqrt{448\times252}}=\frac{336}{\sqrt{1,12,896}}=\frac{336}{336}=1$$
相关系数 = 1
这意味着系列 X 和 系列 Y 的值之间存在完全正相关。
#### 2. 直接法
使用直接法计算相关系数的步骤如下:
- 第一步是计算 X 系列的和 ($\sum{X}$)。
- 现在,计算 Y 系列的和 ($\sum{Y}$)。
- 对 X 系列的值进行平方并计算它们的总和;即,$\sum{X^2}$。
- 对 Y 系列的值进行平方并计算它们的总和;即,$\sum{Y^2}$。
- 将系列 X 和 Y 的值相乘并计算它们的总和;即,$\sum{XY}$。
- 现在,使用以下公式来确定相关系数:
$$r=\frac{N\sum{XY}-\sum{X}.\sum{Y}}{\sqrt{N\sum{X^2}-(\sum{X})^2}{\sqrt{N\sum{Y^2}-(\sum{Y})^2}}}$$
#### 示例:
使用直接法确定以下数据的相关系数:
!数据表
#### 解答:
!相关系数
$$r=\frac{N\sum{XY}-\sum{X}.\sum{Y}}{\sqrt{N\sum{X^2}-(\sum{X})^2}{\sqrt{N\sum{Y^2}-(\sum{Y})^2}}}$$
$$=\frac{(7\times2,856)-(168\times105)}{\sqrt{(7\times4,480)-(168)^2}\times{\sqrt{(7\times1,827)-(105)^2}}}$$
$$=\frac{19,992-17,640}{\sqrt{31,360-28,224}\times{\sqrt{12,789-11,025}}}$$
$$=\frac{2,352}{\sqrt{3,136}\times{\sqrt{1,764}}}=\frac{2,352}{56\times42}$$
$$=\frac{2,352}{2,352}=1$$
相关系数 = 1
这意味着系列 X 和 系列 Y 的值之间存在完全正相关。
#### 3. 简捷法/假定均值法
实际均值有时会出现小数,这会使标准差的计算变得复杂和困难。在这些情况下,建议使用简捷法来简化计算。步骤…