深入解析卡特兰数：从递归到动态规划的算法实战指南

2026-02-04 10:25:19 0条评论 3次阅读 0人点赞

在计算机科学和数学的广阔领域中，序列经常以各种迷人的形式出现，但很少有序列能像卡特兰数这样，以其独特的性质和广泛的应用领域而令人着迷。如果你正在准备面试、钻研算法竞赛，或者仅仅是对组合数学背后的编程艺术感兴趣，那么理解并实现卡特兰数的求解程序无疑是你的必修课之一。

这篇文章将作为一份详尽的指南，带你从最基本的数学定义出发，一步步探索如何计算第 n 个卡特兰数。我们将一起分析不同算法实现的时间复杂度，从直观但低效的递归解法，过渡到更加高效的动态规划方案，并深入探讨代码背后的逻辑。

什么是卡特兰数？

简单来说，卡特兰数是一个由正整数组成的序列，它在计数各种特定的组合结构时扮演着核心角色。序列中的第 n 项通常记作 Cn。从数学上看，它可以通过以下公式定义：

$$C_n = \frac{(2n)!}{((n + 1)! n!)}$$

或者，我们可以使用递归关系来定义它（这一点在编程实现中尤为重要）：

$$C0 = 1, \quad C{n+1} = \sum{i=0}^{n} Ci \times C_{n-i} \quad (n \geq 0)$$

当 n = 0, 1, 2, 3, 4, 5… 时，前几个卡特兰数的序列如下：

1, 1, 2, 5, 14, 42, 132, 429, 1430, 4862, …

为什么卡特兰数如此重要？

你可能会问：“我为什么要关心这个特定的数列？”事实上，卡特兰数在计算机科学中无处不在。让我们看看它究竟解决了哪些实际问题：

括号匹配问题：统计包含 n 对括号且正确匹配的表达式的数量。例如，INLINECODE0a64370c 和 INLINECODEb76fc751 是合法的，而 (())) 是非法的。
二叉搜索树（BST）的计数：统计 n 个不同的节点能构成多少种不同形态的二叉搜索树。这是一个经典的面试题，直接依赖于卡特兰数。
满二叉树计数：统计具有 n+1 个叶子节点的满二叉树的数量（所谓满二叉树，是指每个节点要么没有孩子，要么有两个孩子）。
不相交弦问题：给定一个圆上有 2n 个点，统计将这 2n 个点配对并用 n 条弦连接，且任意两条弦在圆内不相交的方法数。

算法挑战：如何高效计算 Cn？

虽然数学公式提供了直接的计算方法，但在编程中直接计算阶乘（例如 (2n)!）极易导致整数溢出，尤其是在 n 较大的时候。因此，我们通常更倾向于利用其递归性质或动态规划来求解。

#### 示例分析

为了确保我们理解目标，让我们先看几个具体的输入和输出示例，这将帮助我们在编写代码前验证逻辑。

> 输入： n = 6

> 输出： 132

> 解释： C(6) = C(0)C(5) + C(1)C(4) + C(2)C(3) + C(3)C(2) + C(4)C(1) + C(5)C(0) = 132

> 输入： n = 8

> 输出： 1430

> 输入： n = 5

> 输出： 42

方法一：朴素递归法

让我们从最直观的方法开始。既然卡特兰数符合递归定义，那么最直接的代码实现就是模拟这个数学定义。

#### 算法思路

基本条件：当 n <= 1 时，我们知道 C0 和 C1 都等于 1，直接返回 1。
递归步骤：对于 n >= 2，根据公式 $Cn = \sum Ci \times C_{n-1-i}$，我们需要从 i = 0 到 n-1 进行迭代。
累乘求和：在循环中，将递归调用 INLINECODEa0474d32 和 INLINECODE8cb3d70b 的结果相乘，并累加到总结果中。

#### 代码实现

虽然这种方法在教学上非常有价值，因为它直接反映了数学定义，但你会很快发现它的局限性。下面是多种语言的实现：

C++ 实现

// C++ 程序：使用递归查找第 n 个卡特兰数
#include 
using namespace std;

// 递归函数定义
int findCatalan(int n) {
    
    // 基本情况：C0 和 C1 都定义为 1
    if (n <= 1)
        return 1;

    // catalan(n) 等于 catalan(i) * catalan(n-i-1) 的总和
    int res = 0;
    for (int i = 0; i < n; i++)
        res += findCatalan(i) * findCatalan(n - i - 1);

    return res;
}

int main() {
    int n = 6;
    // 当 n 增大时，这个函数的运行时间会显著增加
    int res = findCatalan(n);
    cout << "第 " << n << " 个卡特兰数是: " << res << endl;
    return 0;
}

Java 实现

// Java 程序：使用递归查找第 n 个卡特兰数
class CatalanRecursive {
 
    static int findCatalan(int n) {
        
        // 基本情况处理
        if (n <= 1) {
            return 1;
        }

        // 递归计算总和
        int res = 0;
        for (int i = 0; i < n; i++) {
            res += findCatalan(i) * findCatalan(n - i - 1);
        }

        return res;
    }

    public static void main(String[] args) {
        int n = 6;
        System.out.println("第 " + n + " 个卡特兰数是: " + findCatalan(n));
    }
}

Python 实现

# Python 程序：使用递归查找第 n 个卡特兰数

def find_catalan(n):
    # 基本情况：C0 和 C1 均为 1
    if n <= 1:
        return 1

    # 递归关系：sum of catalan(i) * catalan(n-i-1)
    res = 0
    for i in range(n):
        res += find_catalan(i) * find_catalan(n - i - 1)

    return res

if __name__ == "__main__":
    n = 6
    print(f"第 {n} 个卡特兰数是: {find_catalan(n)}")

JavaScript 实现

// JavaScript 程序：使用递归查找第 n 个卡特兰数

function findCatalan(n) {
    // 基本情况：C0 = C1 = 1
    if (n <= 1) {
        return 1;
    }

    // 计算递归求和
    let res = 0;
    for (let i = 0; i < n; i++) {
        res += findCatalan(i) * findCatalan(n - i - 1);
    }

    return res;
}

let n = 6;
console.log(`第 ${n} 个卡特兰数是: ${findCatalan(n)}`);

#### 性能分析

当你运行上面的代码时，如果 n 的值很小（比如小于 15），结果几乎是瞬间出来的。但是，如果你尝试计算 n=30 的情况，程序可能会“卡死”很久。

时间复杂度： $O(4^n / (n^{3/2} \sqrt{\pi}))$，近似于指数级 $O(2^n)$ 甚至更高。这是因为函数在递归树中重复计算了相同的子问题。例如，计算 C(5) 需要 C(4) 和 C(3)，而计算 C(6) 又需要 C(5) 和 C(4)，导致 C(4) 被计算了两次，这种冗余是呈指数级增长的。
辅助空间： $O(n)$，主要用于递归调用栈的深度。

> 开发经验提示： 在实际面试或生产环境中，纯递归解法通常是无法通过大数据量测试用例的。如果你发现自己写出了上面的代码，一定要意识到下一步必须是记忆化搜索或动态规划。

—

方法二：动态规划（推荐）

既然递归慢是因为重复计算，那么我们如何解决呢？答案是存储中间结果。这就是动态规划（DP）的核心思想。我们可以创建一个一维数组 INLINECODE42959776，其中 INLINECODEe2c1b589 存储第 i 个卡特兰数的值。这样，当需要计算 INLINECODE27f6fdfa 时，所有比它小的 INLINECODE388b3dfe 都已经计算好了，可以直接读取，无需再次递归。

#### 逐步优化思路

初始化：创建一个大小为 INLINECODE8ed18503 的数组 INLINECODE040823a7。根据定义，初始化 INLINECODE7adb6911 和 INLINECODE7ba5bb4a。
填表：从 INLINECODE9b9ba27a 开始遍历到 INLINECODE019ba28b。对于每一个 i，我们根据递推公式计算它的值。
内层循环：对于固定的 INLINECODE9048af10，我们需要计算 $\sum{j=0}^{i-1} dp[j] \times dp[i-j-1]$。

#### 代码实现

这种方法将时间复杂度从指数级降低到了多项式级，是一个巨大的飞跃。

C++ 实现 (动态规划)

// C++ 程序：使用动态规划查找第 n 个卡特兰数
#include 
#include 
using namespace std;

// 返回第 n 个卡特兰数
unsigned long int findCatalan(int n) {
    // 创建一个数组来存储卡特兰数
    // 使用 unsigned long int 以防止较小的 n 发生溢出
    vector dp(n + 1);

    // 初始化前两个值
    dp[0] = 1; // C0
    dp[1] = 1; // C1

    // 从 2 开始填充 dp 表
    for (int i = 2; i <= n; i++) {
        dp[i] = 0; // 初始化当前项为0
        for (int j = 0; j < i; j++) {
            // 应用递推公式：C[i] += C[j] * C[i-j-1]
            dp[i] += dp[j] * dp[i - j - 1];
        }
    }

    // 返回存储在 dp[n] 中的结果
    return dp[n];
}

int main() {
    int n = 10;
    cout << "第 " << n << " 个卡特兰数是: " << findCatalan(n) << endl;
    return 0;
}

Java 实现 (动态规划)

// Java 程序：使用动态规划查找第 n 个卡特兰数
import java.util.*;

class CatalanDP {
    
    // 返回第 n 个卡特兰数
    static long findCatalan(int n) {
        // 创建数组存储结果
        long[] dp = new long[n + 1];
        
        // 基本情况
        dp[0] = 1;
        dp[1] = 1;
        
        // 填充 dp 表
        for (int i = 2; i <= n; i++) {
            dp[i] = 0;
            for (int j = 0; j < i; j++) {
                dp[i] += dp[j] * dp[i - j - 1];
            }
        }
        
        return dp[n];
    }

    public static void main(String[] args) {
        int n = 10;
        System.out.println("第 " + n + " 个卡特兰数是: " + findCatalan(n));
    }
}

Python 实现 (动态规划)

# Python 程序：使用动态规划查找第 n 个卡特兰数

def find_catalan(n):
    if (n == 0 or n == 1):
        return 1

    # 创建一个列表来存储卡特兰数
    dp = [0] * (n + 1)

    # 初始化前两项
    dp[0] = 1
    dp[1] = 1

    # 循环计算剩余的项
    for i in range(2, n + 1):
        dp[i] = 0
        for j in range(i):
            dp[i] += dp[j] * dp[i - j - 1]

    return dp[n]

# 测试代码
n = 10
print(f"第 {n} 个卡特兰数是: {find_catalan(n)}")

JavaScript 实现 (动态规划)

// JavaScript 程序：使用动态规划查找第 n 个卡特兰数

function findCatalan(n) {
    // 创建数组存储计算结果
    let dp = new Array(n + 1).fill(0);

    // 基本情况
    dp[0] = 1;
    dp[1] = 1;

    // 填充 DP 表
    for (let i = 2; i <= n; i++) {
        dp[i] = 0;
        for (let j = 0; j < i; j++) {
            dp[i] += dp[j] * dp[i - j - 1];
        }
    }

    return dp[n];
}

let n = 10;
console.log(`第 ${n} 个卡特兰数是: ${findCatalan(n)}`);

#### 动态规划的性能分析

通过引入数组存储中间状态，我们消除了递归带来的巨大开销。

时间复杂度： $O(n^2)$。我们需要计算 INLINECODE0319426c 个状态，每个状态的计算需要遍历 INLINECODE307c97e4 次循环。这比指数级的递归快得多。
辅助空间： $O(n)$。我们需要一个大小为 n+1 的数组来存储结果。

进阶视角：利用二项式系数

为了让你在面试中脱颖而出，还有一点值得一提。虽然我们使用 DP 求解，但实际上卡特兰数有一个直接基于乘法的公式，利用二项式系数的性质：

$$C_n = \frac{1}{n+1}\binom{2n}{n}$$

这个公式可以进一步优化为 $O(n)$ 时间的计算，避免了 $O(n^2)$ 的双重循环，但它的实现涉及更多的数学技巧（例如处理大数乘除法时的溢出问题）。在实际工程中，如果只需要数值结果，直接使用 DP 方案已经足够高效且不易出错。

关键要点与最佳实践

在这篇文章中，我们深入探讨了如何计算第 n 个卡特兰数。让我们总结一下核心要点：

识别问题模式：当你看到涉及“合法括号序列”、“二叉树计数”或“进出栈顺序”等问题时，第一时间应该联想到卡特兰数。
警惕朴素递归：虽然代码写起来简单，但朴素递归在 n > 20 时基本不可用。
拥抱动态规划：$O(n^2)$ 的 DP 解法是平衡了代码可读性和性能的最佳选择，完全能够应对大多数面试场景。
注意数据类型：卡特兰数增长极快。C(30) 已经超过了 32 位整数的范围，C(35) 超过了 64 位整数的范围。在编写生产环境代码时，如果 n 很大，请考虑使用 BigInteger 或模运算来限制结果大小。

下一步行动

我鼓励你自己动手实现上述的 DP 代码。尝试修改 n 的值，观察输出结果的变化。你甚至可以尝试结合二项式系数的公式，编写一个时间复杂度为 $O(n)$ 的函数来挑战自己。

希望这篇指南能帮助你更好地理解卡特兰数及其在编程中的应用。如果你喜欢这种深入浅出的技术解析，请继续关注更多的算法优化与实战技巧！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客