二项分布和泊松分布是统计学和数据分析中两种重要的离散概率分布类型。二项分布用于对固定次数的独立试验中的成功次数进行建模,每次试验具有相同的成功概率。另一方面,泊松分布用于对在固定时间或空间间隔内发生的事件次数进行建模,前提是这些事件具有恒定的平均发生率。
在本文中,我们将详细探讨“二项分布与泊松分布的区别”,包括它们各自的属性和示例。
什么是二项分布?
二项分布 是一种离散概率分布,它描述了在固定次数的独立二元(是/否)试验中取得成功的次数。它是统计学中最常用的概率分布之一。
二项分布源于一系列被称为伯努利试验的实验。每次试验的结果要么是成功,要么是失败,且每次试验中成功的概率都是相同的。该分布由两个参数定义:
- n:试验的总次数。
- p:单次试验成功的概率。
二项随机变量的概率质量函数给出如下:
> P(X = k) = \binom{n}k{}p^k(1 − p)^{n−k}
其中,
- n 是试验次数,
- k 是成功次数,
- p 是成功概率,
- \binom{n}{k} 是二项系数,表示在 n 次试验中选择 k 次成功的组合数。
二项分布的性质
二项分布的一些关键性质如下:
公式
—
μ = E(X) = np
σ2 = Var(X) = np(1 − p)
σ = √[np(1−p)]
Skewness = (1 – 2p)/[√[np(1−p)]]
Kurtosis = [1 − 6p(1 − p)]/[np(1 − p)]
P(X = k) = \binom{n}k{}p^k(1 − p)^{n−k}
MX(t) = [pet + (1−p)]n### 二项分布的示例
下面我们来讨论一些二项分布的示例:
- 制造业中的质量控制: 一家工厂生产灯泡,每个灯泡有 2% 的概率是次品。如果我们随机抽取 100 个灯泡作为样本,我们可以使用二项分布来找出一定数量的次品灯泡出现的概率。
- 临床试验: 正在测试一种新药,已知其在 70% 的病例中有效。在的一项临床试验中,10 名患者接受了这种药物的治疗。
- 体育统计: 在一场篮球比赛中,一名球员的罚球命中率为 80%。在比赛期间,该球员进行了 15 次罚球。
什么是泊松分布?
泊松分布 是一种离散概率分布,它表示在固定时间或空间间隔内发生给定数量事件的概率,前提是这些事件以已知的恒定平均速率发生,且独立于自上次事件以来经过的时间。它是以法国数学家西梅翁·德尼·泊松的名字命名的。
如果随机变量 X 表示在固定时间或空间间隔内发生的事件数量,则它服从泊松分布。泊松随机变量的概率质量函数给出如下:
> P(X = k) = (λke−λ)/k!
其中:
- k 是发生的次数,
- λ 是该间隔内的平均发生次数,
- e 是自然对数的底(约等于 2.71828)。
泊松分布的性质
泊松分布的一些关键性质如下:
公式
—
μ = E(X) = λ
σ2 = Var(X) = λ
σ = √λ
Skewness = 1/√λ
Kurtosis = 1/λ
M_{X}(t) = e^{λ(e^t − 1)}### 泊松分布的示例
以下是一些可以使用泊松分布建模的最常见示例:
- 呼叫中心: 一个呼叫中心平均每分钟收到 5 个电话。我们可以使用泊松分布来计算在一分钟内收到特定数量电话的概率。
- 交通流量: 平均每 10 分钟有 2 辆车通过一个检查站。我们可以使用泊松分布来计算在 10 分钟内有一定数量汽车通过检查站的概率。
- 网站流量: 一个网站平均每小时收到 10 次访问。我们可以使用泊松分布来计算在一小时内收到特定数量访问的概率。
二项分布 Vs. 泊松分布
下表列出了二项分布和泊松分布之间的主要区别:
| 特性