在统计学中,Z-Score(Z分数) 是一种衡量数据点与分布均值之间距离的标准,它以标准差为单位来表示这种距离。如果 Z 分数为 0,意味着该数据点的分数与平均分相同。正的 Z 分数表示数据点高于平均水平,而负的 Z 分数则表示数据点低于平均水平。
它提供了一种通过标准化数值来比较不同分布中单个数据点的方法,即使原始数据集具有不同的均值和标准差,也能让我们进行有意义的比较。
什么是 Z-Score?
Z 分数,也被称为 标准分数,它通过以均值上下的标准差为单位来表示偏差,从而告诉我们一个数据点与均值的偏离程度。它让我们直观地了解到一个数据点距离均值有多远。因此,Z 分数是以距离均值的标准差数来衡量的。例如,Z 分数为 2 表示该数值距离均值 2 个标准差。要使用 Z 分数,我们需要知道总体均值(μ)以及总体标准差(σ)。
> Z 分数是一种统计度量,用于描述数值相对于一组数值的均值的位置。它以距离均值的标准差数来表示。Z 分数表明了一个元素距离均值有多少个标准差。
Z-Score 公式
要计算任何给定数据的 Z 分数,我们需要元素的具体数值以及均值和标准差。我们可以使用以下 Z 分数公式来计算。
> #### z = (X – μ) / σ
其中,
- z = Z-Score(Z 分数)
- X = 元素的数值
- μ = 总体均值
- σ = 总体标准差
如何计算 Z-Score?
如果我们已知总体 mean(均值 μ)、总体标准差(σ)和观测值,我们可以将这些数值代入 Z 分数公式来计算 Z 分数值。根据给定的 Z 分数是正数还是负数,我们可以使用在线提供的 正态分布 Z 表 或 负态分布 Z 表,或者在统计学教科书附录的背面查找。
示例 1:假设你参加了 GATE 考试并获得了 500 分。GATE 考试的平均分是 390 分,标准差是 45 分。与普通考生相比,你的考试成绩如何?
> #### 解决方案:
>
> 上述问题陈述中 readily 可获得以下数据
>
> 原始分数/观测值 = X = 500
>
> 平均分 = μ = 390
>
> 标准差 = σ = 45
>
> 通过应用 Z 分数公式,
>
> z = (X – μ) / σ
>
> z = (500 – 390) / 45
>
> z = 110 / 45 = 2.44
>
> 这意味着你的 Z 分数是 2.44。
>
> 由于 Z 分数是正数 2.44,我们将使用正态分布 Z 表。
>
> 现在让我们查看 Z 表 (CC-BY) 来了解你与其他考生相比的表现如何。
>
> 按照以下说明从表中查找概率。
>
> 在这里,z-score = 2.44,这表示数据点比均值高 2.44 个标准差。
>
> 1. 首先,在 Y 轴上定位前两位数字 2.4。
> 2. 然后沿着 X 轴,定位 0.04。
> 3. 结合两个轴。两者的交点将为你提供与你正在查找的 Z 分数值相关联的累积概率。
>
> [该概率表示标准正态曲线在 Z 分数左侧的面积]
!Normal distribution table 正态分布表
> 结果是,你将得到的最终值为 0.99266。
>
> 现在,我们需要将我们在 GATE 考试中的原始分数 500 与批次平均分进行比较。为此,我们需要将与 Z 分数相关联的累积概率转换为百分比值。
>
> 0.99266 × 100 = 99.266%
>
> 最后,你可以说你的表现优于几乎 99% 的其他考生。
示例 2:一个学生得分在 350 到 400 之间的概率是多少(平均分 μ 为 390,标准差 σ 为 45)?
解决方案:
> 最低分 = X1 = 350
>
> 最高分 = X2 = 400
>
> 通过应用 Z 分数公式,
>
> z1 = (X1 – μ) / σ
>
> z1 = (350 – 390) / 45
>
> z1 = -40 / 45 = -0.88
>
> z2 = (X2 – μ) / σ
>
> z2 = (400 – 390) / 45
>
> z2 = 10 / 45 = 0.22
>
> 由于 z1 是负数,我们必须查看负态分布 Z 表并找到该累积概率