中位数的定义
中位数是将数据集按照升序或降序排列后,位于中间位置的值。
- 如果数据集包含奇数个数值,中位数就是正中间的那个值。
- 如果数据集包含偶数个数值,中位数则是中间两个数值的平均值。
示例:假设我们有5位朋友的身高数据,分别是 167 cm、169 cm、171 cm、174 cm 和 179 cm。当我们按顺序排列这些数据时,中间的数值是 171 cm,因此中位数身高就是 171 cm。
!<a href="https://media.geeksforgeeks.org/wp-content/uploads/20251118160149760847/medianheightcalcuration-660.webp">medianheightcalcuration
> 中位数将数据一分为二。它展示了数据集的中间位置,并能让我们更好地理解“典型”值,特别是在数据包含极大值或极小值的情况下。
为什么中位数很有用?
> – 它不受异常值的影响(这点与平均值不同)。
> – 它展示了数据的中心位置。
> – 它对于偏态分布非常有用(例如收入、房价)。
> – 它有助于对数据集进行排名和比较。
中位数示例
让我们来看几个关于中位数的例子:
示例 1:五位朋友的中位数薪水。每位朋友的薪水如下:
- 74,000
- 82,000
- 75,000
- 96,000
- 88,000
> 首先,我们将这些数字按升序排列:74,000、75,000、82,000、88,000 和 96,000。然后通过观察数据,我们得到中位数薪水为 82,000。
示例 2: 一个群体的年龄中位数 – 考虑一组人的年龄:25、30、27、22、35 和 40 岁。
> 首先,将年龄按升序排列:22、25、27、30、35、40。中位数年龄是位于中间的值,在这种情况下是 30 岁。
中位数公式
正如我们所知,中位数是任何数据的中间项。当数据线性排列时,找到中间项非常简单,但当给定的数据数量为偶数或奇数时,计算中位数的方法会有所不同。
例如,
- 如果我们有 3 个(奇数)数据 1、2 和 3,那么 2 就是中间项,因为它左边有一个数字,右边也有一个数字。所以寻找中间项非常简单。
- 但是,当我们给定偶数个数据(比如 4 个数据集)1、2、3 和 4 时,寻找中位数就变得比较棘手,因为通过观察我们可以看到没有单一的中间项,因此为了找到中位数,我们需要使用不同的概念。
未分组数据的中位数
中位数公式通过两种方法计算:
- 中位数公式(当 n 为奇数时)
- 中位数公式(当 n 为偶数时)
中位数公式(当 n 为奇数时)
如果数据集中的数值个数(n 值)为奇数,那么计算中位数的公式为:
中位数公式(当 n 为偶数时)
如果数据集中的数值个数(n 值)为偶数,那么计算中位数的公式为:
分组数据的中位数
分组数据是指给出了数据类区间频率和累积频率的数据。分组数据的中位数是使用以下公式计算的,
> 中位数 = l + [(n/2 – cf) / f]×h
其中,
- l 是中位数所在类的下限
- n 是观测值的数量
- f 是中位数所在类的频率
- h 是类的大小(组距)
- cf 是中位数所在类前一类的累积频率
示例: 求以下数据的中位数。
如果学生在一次满分为 50 分的课堂测验中得分如下:
0-10
20-30
40-50
—
—
—
5
6
5解决方案:
> 为了求中位数,我们必须建立一个包含累积频率的表,如下所示:
>
>
0-10
20-30
40-50>
—
—
—>
5
6
5>
0+5 = 5
13+6 = 19
25+5 = 30>
> n = ∑fi = 5+8+6+6+5 = 30 (偶数)
>
> n/2 = 30/2 = 15
>
> 中位数所在类 = 20-30
>
> 现在使用公式,
>
> 中位数 = l + [(n/2 – cf) / f]×h
>
> 与给定数据对比,我们得到,
>
> – l = 20
> – n = 30
> – f = 6
> – h = 10
> – cf = 13
>
> 中位数 = 20 + [(15 – 13)/6] × 10
>
> = 20 + (2/6) x 10
>
> = 60/3 + 10/3
>
> = 20 + 3.3333 = 23.33 (约等于)
>
> 因此,该次课堂测验的中位数分数是 23.33。
如何求中位数?
为了找到数据的中位数,我们可以按照下面讨论的步骤进行操作:
> 步骤 1: 将给定的数据按升序或降序排列。
>
> 步骤 2: 数一下数据值的个数。
>
> 步骤 3: 根据步骤 2 中得到的 n 值,如果 n 为偶数,则使用偶数公式;如果 n 为奇数,则使用奇数公式来计算中位数。
>