深入理解斯特林公式：从理论推导到工程实战

2026-02-02 07:27:33 0条评论 66次阅读 0人点赞

在计算机科学和数学的广阔天地中，阶乘是一个无处不在的概念。从排列组合到复杂度分析，我们经常需要面对像 100! 这样天文数字般的数值。你有没有想过，当 n 变得非常大时，如何快速估算 n! 的值而不必进行繁琐的乘法运算？或者，在分析算法时，如何将 n! 这样难以处理的项转化为更易处理的对数形式？

在这篇文章中，我们将深入探讨一个强大的数学工具——斯特林近似公式。我们将从它的基本定义出发，探讨其在算法分析中的重要性，并通过大量的代码示例和实际应用场景，帮助你完全掌握这一技术。

1 什么是斯特林近似？
2 算法分析中的关键角色
3 精度验证：数学与代码的结合
4 编码实战：斯特林公式的多种实现
5 实际应用场景与最佳实践
6 总结

什么是斯特林近似？

斯特林近似是一个非常著名的公式，用于近似大数阶乘。简单来说，它告诉我们，阶乘的自然对数可以近似表示为：

$$ \ln(n!) \approx n \ln(n) – n $$

更精确地，对于非负整数 n，n! 的近似值为：

$$ n! \approx \sqrt{2\pi n} \left(\frac{n}{e}\right)^n $$

这里，$e$ 是自然对数的底数（约等于 2.71828），$\pi$ 是圆周率。

为什么我们需要它？

你可能会问，既然计算机可以计算阶乘，为什么还需要近似？主要有以下几个原因：

数值溢出：阶乘的增长速度快得惊人。普通的 64 位整数很快就会溢出。即使使用大整数库，计算 10000! 也会消耗大量的内存和时间。
算法分析：在推导算法的时间复杂度（特别是基于比较的排序算法）的下界时，我们需要对 $n!$ 取对数。斯特林公式能帮我们将 $n!$ 转化为 $n \ln n$ 的形式，从而简化数学推导。
物理与统计：在统计力学和概率论中，斯特林公式是处理大数量级系统的基石（例如在热熵的计算中）。

算法分析中的关键角色

让我们来看看斯特林公式在计算机科学中最重要的应用之一：确定基于比较的排序算法的下界。

我们知道，n 个不同的元素有 $n!$ 种排列方式。为了找到正确的排序结果，基于比较的算法必须能够区分这 $n!$ 种可能性。每一次比较只能产生两个分支（大于或小于），因此决策树的高度至少为 $\log_2(n!)$。

如果我们直接计算 $\log_2(n!)$，很难看出增长趋势。但利用斯特林近似公式：

$$ \ln(n!) = n \ln(n) – n + O(\ln n) $$

我们可以得出结论，$\log(n!)$ 的增长受 $n \log n$ 的限制。这就是为什么我们说比较排序算法的时间复杂度下界是 $O(n \log n)$ 的理论基础。如果没有这个公式，我们将很难从数学上严格证明这一结论。

精度验证：数学与代码的结合

为了让你对这个公式的精度有一个直观的感受，让我们通过几个具体的例子来验证一下。你会发现，随着 n 的增加，这个公式的准确度惊人地高。

问题 1：计算 6! 的近似值

我们来看看当 n = 6 时的情况。

精确值：$6! = 720$
近似计算：

$$ 6! \approx \sqrt{2 \times \pi \times 6} \times \left(\frac{6}{e}\right)^6 \approx 719.19 $$

误差分析：相对误差仅为 0.11%。

问题 2：计算 11! 的近似值

当 n 增大到 11 时：

精确值：$11! = 39,916,800$
近似计算：

$$ 11! \approx \sqrt{2 \times \pi \times 11} \times \left(\frac{11}{e}\right)^{11} \approx 39,615,625.05 $$

误差分析：相对误差约为 0.75%。可以看到，虽然 n 增大，绝对误差变大了，但相对误差依然非常小。

问题 3：计算 5! 和 7! 的近似值

让我们再看看 n = 5 和 n = 7 的情况，以观察波动的趋势：

对于 $5!$：

精确值：120
近似值：118.96
误差：0.86%

对于 $7!$：

精确值：5040
近似值：4980.39
误差：1.18%

问题 4：计算 9! 和 13! 的近似值

当 n 继续增大，我们可以观察到一个有趣的现象：误差并不是单调递减的，而是呈现出一种震荡收敛的趋势。

对于 $9!$：

精确值：362,880
近似值：359,536.87
误差：0.92%

对于 $13!$：

精确值：6,227,020,800
近似值：6,187,239,475.19
误差：0.63%

极限情况：3! 的误差

对于较小的 n，比如 3：

精确值：6
近似值：5.84
误差：2.67%

由此可见，当 n 较小时，虽然误差相对较大，但对于一个估算公式来说，2.67% 的误差在许多工程场景下也是完全可以接受的。

编码实战：斯特林公式的多种实现

作为开发者，仅仅理解数学公式是不够的，我们需要将其转化为代码。下面我们将提供多个 Python 实现示例，涵盖从基础计算到性能优化和可视化。

基础实现

这是最直接的翻译版本，方便你理解公式与代码的一一对应关系。

import math

def stirling_approximation_basic(n):
    """
    斯特林公式的基础实现
    公式: sqrt(2*pi*n) * (n/e)^n
    """
    if n == 0: return 1
    # 计算 sqrt(2 * pi * n) 部分
    factor_1 = math.sqrt(2 * math.pi * n)
    
    # 计算 (n/e)^n 部分
    factor_2 = (n / math.e) ** n
    
    return factor_1 * factor_2

# 示例使用
n = 10
approx_val = stirling_approximation_basic(n)
exact_val = math.factorial(n)

print(f"输入 n = {n}")
print(f"近似值: {approx_val:.4f}")
print(f"精确值: {exact_val}")
print(f"相对误差: {abs((approx_val - exact_val) / exact_val) * 100:.5f}%")

对数空间实现（防止溢出）

在处理大数（如 n > 170）时，普通的阶乘计算会直接导致 OverflowError。而在机器学习或统计物理中，我们通常需要计算 $\ln(n!)$ 而不是 $n!$。斯特林公式的对数形式 $(n \ln n – n)$ 非常适合这种情况，因为它永远不会溢出。

def stirling_log_approximation(n):
    """
    斯特林公式的对数形式实现。
    用于估算 ln(n!)，防止大数计算时的溢出问题。
    """
    if n == 0: return 0
    return n * math.log(n) - n

def stirling_log_with_correction(n):
    """
    带有修正项的斯特林对数公式，精度更高。
    公式: ln(n!) ≈ n*ln(n) - n + 0.5*ln(2*pi*n)
    """
    if n == 0: return 0
    return n * math.log(n) - n + 0.5 * math.log(2 * math.pi * n)

# 测试大数场景
large_n = 1000

print(f"--- 大数测试 n = {large_n} ---")
# math.factorial(1000) 数值太大，直接计算 log 会更安全
# 我们可以利用 math.lgamma 函数（ln(abs(gamma(x)))）来获取高精度的真值作为对比
true_log_val = math.lgamma(large_n + 1)

approx_log_simple = stirling_log_approximation(large_n)
approx_log_full = stirling_log_with_correction(large_n)

print(f"真实值: {true_log_val:.5f}")
print(f"斯特林近似: {approx_log_simple:.5f}")
print(f"带修正项近似: {approx_log_full:.5f}")
print(f"修正后的误差大幅降低！")

性能对比测试

让我们来做一个简单的基准测试，看看直接计算阶乘和使用斯特林近似在速度上的差异。虽然 Python 的 math.factorial 已经高度优化，但在极端大数情况下，近似计算的优势会体现出来（尤其是在需要重复计算的蒙特卡洛模拟中）。

import time

def benchmark_factorial_vs_stirling(n, iterations=10000):
    """
    对比直接计算阶乘和斯特林近似的性能
    """
    # 测试 math.factorial
    start_time = time.time()
    for _ in range(iterations):
        val = math.factorial(n)
    end_time = time.time()
    fact_time = end_time - start_time

    # 测试斯特林近似
    start_time = time.time()
    for _ in range(iterations):
        val = stirling_approximation_basic(n)
    end_time = time.time()
    approx_time = end_time - start_time

    print(f"--- 性能对比 (n={n}, 迭代{iterations}次) ---")
    print(f"math.factorial 耗时: {fact_time:.6f} 秒")
    print(f"斯特林近似耗时: {approx_time:.6f} 秒")
    print(f"性能提升倍数: {fact_time / approx_time:.2f}x")

# 注意：对于较小的 n，factorial 非常快，优势不明显。
# 但对于极大数，近似计算的优势在于不需要处理巨大的整数乘法。
benchmark_factorial_vs_stirling(100, 10000)

实际应用场景与最佳实践

了解了基础和代码之后，让我们看看在实际工程中如何运用它。

1. 排列组合的快速估算

假设你正在编写一个推荐系统，需要计算从 100 万个物品中选出 10 个的组合数 $C(1000000, 10)$。直接计算阶乘不仅慢，而且极易溢出。

我们可以利用斯特林公式的对数形式来计算 $\ln(C(n, k))$，然后取指数。这是处理大数组合统计的标准做法。

$$ \ln(C(n, k)) = \ln(n!) – \ln(k!) – \ln((n-k)!) $$

2. 信息熵的计算

在信息论中，熵的计算经常涉及 $\log(n!)$ 的项。当样本空间很大时，斯特林近似是必不可少的简化工具。

3. 常见错误与解决方案

错误 1：在小 n 时误用近似。

* 场景：当 n < 5 时，斯特林近似的误差可能超过 5%。

* 解决方案：在代码中添加阈值判断。if n < 10: return exact_factorial(n)，否则使用近似。

错误 2：忽略浮点数精度限制。

* 场景：虽然公式避免了整数溢出，但 $(n/e)^n$ 的结果在 n 极大时可能超出浮点数范围（变成 inf）。

* 解决方案：始终优先考虑在对数空间进行运算，只在做最终展示或必要时才转换回实数空间。

总结

斯特林近似公式不仅仅是一个数学奇观，它连接了离散数学（阶乘）与连续数学（微积分），为我们处理大规模系统提供了一把钥匙。

在这篇文章中，我们不仅学习了公式 $n! \approx \sqrt{2\pi n} (n/e)^n$，还深入探讨了它在算法复杂度分析（证明 $O(n \log n)$ 下界）中的核心作用。我们通过多个 Python 示例，从基础实现到防溢出的对数实现，展示了如何在实际代码中应用这一理论。

关键要点回顾：

公式记忆：记住核心形式 $\ln(n!) \approx n \ln n – n$，这在分析算法时最常用。
精度意识：随着 n 的增加，相对误差显著降低，但对于小 n 要谨慎使用。
实战技巧：在处理可能溢出的阶乘计算时，优先考虑在对数域使用斯特林近似。

无论你是为了应对算法面试，还是正在开发需要处理大规模数据统计的系统，掌握斯特林近似都将是你的武器库中一件强有力的装备。下次当你遇到 $n!$ 这样棘手的问题时，试试看用斯特林的眼光去审视它，也许你会发现一片更广阔的天地。

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客