假设我们想要比较两所学校学生的年龄,以确定哪所学校的学生年龄更大。如果我们基于单个学生进行比较,很难得出任何结论。然而,如果我们能找到一个能够代表数据特征并能代表整体数据的值,比较就会变得容易得多。
能够代表整体数据并表征其特征的值称为数据的平均数。有三种类型的平均数对于分析数据非常有用。它们是:
- 平均数
- 中位数
- 众数
在本文中,我们将学习这三种用于数据分析的平均数类型。
目录
- 平均数
- 计算分组数据平均数的方法
- 中位数
- 众数
- 累积曲线
观测值的平均数是所有观测值的总和除以观测值的总数。数据的平均数由 x = f1x1 + f2x2 + …. + fnxn/f1 + f2+… + fn 给出。平均数公式由以下公式给出:
> 平均数 = ∑(fi.xi)/∑fi
计算分组数据平均数的方法
要计算分组数据的平均数,我们可以使用以下方法:
- 直接法
- 假定平均数法
- 步长偏差法
让我们详细讨论一下这些方法:
方法 1:计算平均数的直接法
要使用直接法求平均数,我们可以使用以下步骤:
步骤 1: 对于每个类别,找到类别标记 xi,如下所示:
> x = 1/2(下限 + 上限)
步骤 2: 计算每个 i 的 fi.xi。
步骤 3: 使用公式 平均数 = ∑(fi.xi)/∑fi.
示例:求以下数据的平均数。
0-10
20-30
40-50
—
—
—
12
6
9解:
> 我们可以准备下表:
>
>
频数 fi
( fi.xi )>
—
—>
12
60>
16
240>
6
150>
7
245>
9
405>
∑fi=50
∑fi.xi=1100>
> 平均数 = ∑(fi.xi)/∑fi = 1100/50 = 22
方法 2:计算平均数的假定平均数法
为了在这种情况下计算平均数,我们可以按以下步骤进行。
> 步骤 1: 对于每个类别区间,使用公式计算类别标记 x: xi = 1/2 (下限 + 上限)。
>
> 步骤 2: 选择一个合适的平均数值并将其记为 A。将中间的 x 作为假定平均数并将其记为 A。
>
> 步骤 3: 计算每个 i 的偏差 di = (x, -A)。
>
> 步骤 4: 计算每个 i 的乘积。
>
> 步骤 5: 求出 n = ∑fi
>
> 步骤 6: 使用公式计算平均数 x: X = A + ∑fidi/n.
示例:使用假定平均数法,求以下数据的平均数:
0-10
20-30
40-50
—
—
—
7
12
10解:
> 设 A = 25 为假定平均数。然后我们有,
>
>
频数fi
偏差di=(xi-25)
>
—
—
>
7
-20
>
8
-10
>
12
0
>
13
10
>
10
20
>
∑fi = 50
>
> 平均数 = X = A + ∑fidi/n = (25 + 110/50) = 27.2
检查: 算术平均数
方法 3:计算平均数的步长偏差法
当 x 和 f 的值很大时,使用上述方法计算平均数变得非常繁琐。在这种情况下,我们使用下面给出的步长偏差法。
> 步骤 1: 对于每个类别区间,计算类别标记 x,其中 X = 1/2 (下限 + 上限)。
>
> 步骤 2: 在 x 列的中间选择一个合适的 x 值作为假定平均数,并将其记为 A。
>
> 步骤 3: 计算 h = [(上限) – (下限)],这对于所有类别都是相同的。
>
> 步骤 4: 计算每个类别的 ui = (xi -A) /h。
>
> 步骤 5: 计算每个类别的 fu,从而求出 ∑(fi × ui)。
>
> 步骤 6: 使用公式计算平均数: x = A + {h × ∑(fi × ui)/ ∑f