二项分布是一种概率分布,用于对在固定次数的独立试验中出现的成功次数进行建模,其中每次试验只有两种可能的结果:成功或失败。这种分布适用于计算在抛硬币、质量控制或调查预测等特定场景下获得特定次数成功的概率。
> 示例: 想象一下,我们将一枚硬币抛掷 5 次。每次抛掷只能得到正面或反面,而且每次得到正面的概率都是一样的。此外,一次抛掷的结果不会影响下一次。现在,如果我们想知道在这 5 次抛掷中恰好得到 3 次正面的几率有多大,这种情况就是我们需要使用二项分布的场景。
二项分布基于伯努利试验,其中每次试验都有独立且相同的成功概率。
!<a href="https://media.geeksforgeeks.org/wp-content/uploads/20250723182638251176/frame3051.webp">frame3051二项分布图
二项分布的条件
在满足以下条件的情况下,我们可以使用二项分布:
- 固定的试验次数:试验或实验有一个设定的次数(记为 n),例如将硬币抛掷 10 次。
- 两种可能的结果:每次试验只有两种可能的结果,通常标记为“成功”和“失败”。例如,抛硬币时得到正面或反面。
- 独立的试验:每次试验的结果与其他试验无关,这意味着一次试验的结果不会影响另一次试验的结果。
- 恒定的概率:每次试验成功的概率(记为 p)保持不变。例如,如果你抛的是一枚均匀的硬币,得到正面的概率始终是 0.5。
当我们计算在给定试验中获得特定次数成功的概率时,二项分布是一个非常合适的模型。
二项分布公式
二项分布公式用于计算概率,对于随机变量 X = 0, 1, 2, 3,….,n,公式如下:
> P(X = r) = nCr pr (1-p) n-r, r = 0, 1, 2, 3….
其中,
- n = 总试验次数
- r = 成功的次数
- p = 成功的概率
示例: 一枚均匀硬币被抛掷 3 次。求恰好得到 2 次正面的概率。
解决方案:
> 试验次数,n = 3
>
> 得到正面(成功)的概率,p = 0.5;得到反面(失败)的概率,q = 1 − p = 0.5
>
> 需要的成功次数,r = 2
>
> P(X = r) = nCr pr (1-p) n-r
>
> P(X = 2) = 3C2 (0.5) 2 (0.5) 1 = 3 x 0.25 x 0.5 = 0.375 或 37.5 %
二项随机变量
二项随机变量 X 用于计算 n 次独立试验中“成功”的次数,每次试验有两个结果:成功(概率为 p)或失败(概率为 1−p),且所有试验的成功概率 p 保持恒定。
示例:
> 一枚均匀硬币被抛掷 20 次;
> 成功:“正面”(p=0.5)。
> 随机变量 X:在 20 次抛掷中观察到的正面次数。
> 分布:X ∼ Binomial (n=20, p=0.5)。
>
> 恰好得到 10 次正面的概率计算如下,(r=10)
>
> P(X=10) = 20C10 (0.5)10(0.5)10 ≈ 0.176 (17.6%)
负二项分布
负二项分布用于对在一系列独立试验中达到特定成功次数所需的试验次数进行建模,其中每次试验成功的概率是恒定的。
例如,考虑掷骰子时掷出 6 为成功的情况。现在如果我们掷出骰子但没有得到 6,这就是一次失败。我们再次掷骰子,也没有得到 6。假设我们连续三次都没有得到 6,而在第四次尝试及以后得到了 6,那么得到 6 的次数的二项分布就被称为负二项分布。
负二项分布公式
负二项分布的公式如下:
> P(x) = n+r-1Cr-1 pr(1-p) n
其中,
- n = 总试验次数。
- r = 我们获得第一次成功所需的试验次数。
- p = 每次试验成功的概率。
- (1-p) = 每次试验失败的概率。
二项分布中的伯努利试验
伯努利试验是一系列独立的实验,其中每个实验(或试验)恰好产生两种可能的结果:
- 成功(概率为 p)
- 失败(概率为 1−p)
如果一个随机实验满足以下条件,我们就称其为伯努利试验:
- 试验数量是有限的
- 试验彼此之间是独立的
- 每次试验只有两种可能的结果
- 每次试验中成功和失败的概率