深入解析中缀表达式求值：从原理到高性能实现

2026-02-09 03:45:43 0条评论 1次阅读 0人点赞

在计算机科学和软件开发中，表达式求值是编译器设计、计算器开发以及复杂业务规则引擎的核心基础。你是否想过，当我们写下 3 + 4 * 5 这样一行简单的算式时，计算机是如何知道“先乘除后加减”，从而得出 23 而不是 35 的？这就是中缀表达式求值的魅力所在。

在这篇文章中，我们将一起深入探索中缀表达式的内部机制。我们将从最基本的概念出发，逐步构建一个能够处理复杂运算符（包括优先级和结合性）的求值器。无论你是在准备技术面试，还是正在开发一个需要动态计算公式的系统，这篇文章都将为你提供从理论到实践的完整指南。

什么是中缀表达式？

中缀表达式是我们日常数学中最熟悉的表示法。它的特点是运算符位于两个操作数之间，例如 A + B。这种写法虽然符合人类的直觉，但对于计算机来说，直接按从左到右的顺序解析却是一个挑战。

为什么它很难直接计算？

这是因为运算符之间存在优先级和结合性的差异。

优先级：决定了在没有括号的情况下，哪个运算先执行。通常，乘除 (INLINECODE0e91f69d, INLINECODEcbee9d27) 高于加减 (INLINECODEdcb00bff, INLINECODE95e934d3)，幂运算 (^) 通常最高。
结合性：当优先级相同时，决定了运算的方向。大多数运算符是左结合的（如 INLINECODE56404b9c 等价于 INLINECODEc3d18a7d），但幂运算通常是右结合的（如 INLINECODEa7bfaea9 等价于 INLINECODE984eabb5）。

核心问题：如何处理优先级与结合性

为了正确求值，我们不能简单地遍历数组。让我们看一个具体的例子来理解其中的陷阱。

示例 1：混合运算与优先级

假设我们有一个字符串数组 arr = ["100", "+", "200", "/", "2", "*", "5", "+", "7"]。

如果我们直接从左向右计算：

100 + 200 = 300
300 / 2 = 150
150 * 5 = 750
750 + 7 = 757 (这是错误的结果！)

正确的做法是遵循数学规则：

先处理除法和乘法（同级，左结合）：

– 200 / 2 = 100

– 100 * 5 = 500

再处理加法：

– 100 + 500 = 600

– 600 + 7 = 607

示例 2：右结合性

考虑输入 arr = ["2", "^", "3", "^", "2"]。

如果是左结合：(2 ^ 3) ^ 2 = 8 ^ 2 = 64
但幂运算是右结合的：2 ^ (3 ^ 2) = 2 ^ 9 = 512。

我们的算法必须能够识别这种特殊的结合性，否则在处理连乘方时就会得出错误的结论。

解决方案：双栈法（Shunting Yard 算法的变体）

要解决这个问题，最经典且高效的方法是使用两个栈：

操作数栈：用于存储数字。
运算符栈：用于存储运算符。

核心逻辑：

我们从左到右扫描表达式。

遇到数字：直接压入操作数栈。
遇到运算符：这需要技巧。我们需要查看运算符栈顶的元素。

– 如果栈顶运算符的优先级更高（或者优先级相同但栈顶是左结合的），意味着栈顶的运算应该先执行。我们弹出栈顶运算符，弹出两个操作数进行计算，并将结果压回操作数栈。然后再次检查新栈顶。

– 如果栈顶运算符优先级更低，或者优先级相同但当前是右结合的，则将当前运算符压入栈中。

– 当然，如果栈为空，直接压入。

这种方法确保了每当我们要压入一个新运算符时，所有必须在它之前运算的“老大哥”运算符都已经被处理掉了。

代码实现：从 C++ 到 C

为了确保代码的鲁棒性，我们需要处理几个细节：

数字识别：输入可能是字符串形式的整数，甚至包含负号（虽然在这个特定问题中通常假设负数作为独立操作数处理）。
地板除：C++ 和 C 中的整数除法默认就是向零取整（截断），但数学上的地板除在处理负数时行为不同（例如 -3 / 2 在截断是 -1，但在地板除中应为 -2）。根据题目要求，我们需要特别处理负数的除法逻辑。

让我们看看完整的 C++ 实现。

#### 完整的 C++ 解决方案

这个实现不仅展示了算法，还包含了处理“地板除”和“右结合性”的详细逻辑。

#include 
#include 
#include 
#include 
#include 

using namespace std;

// 辅助函数：执行具体的数学运算
// 这里的关键是要处理地板除 的逻辑
int applyOperation(int a, int b, char op) {
    switch (op) {
        case ‘+‘: return a + b;
        case ‘-‘: return a - b;
        case ‘*‘: return a * b;
        case ‘/‘: 
            // C++ 默认的除法是向零取整。
            // 地板除逻辑：如果结果是负数且有余数，需要减 1
            if (a * b < 0 && a % b != 0) 
                return (a / b) - 1;
            return a / b;
        case '^': return (int)pow(a, b); // 幂运算
        default: return 0;
    }
}

// 辅助函数：定义运算符的优先级
// 返回值越大，优先级越高
int getPrecedence(char op) {
    if (op == '+' || op == '-') return 1;
    if (op == '*' || op == '/') return 2;
    if (op == '^') return 3;
    return 0;
}

// 辅助函数：判断是否为右结合
// 只有幂运算 '^' 是右结合的
bool isRightAssociative(char op) {
    return op == '^';
}

// 核心函数：求值中缀表达式
int evaluateInfix(vector& arr) {
    stack values; // 操作数栈
    stack ops;   // 运算符栈

    for (int i = 0; i  当前运算符
            // 2. 优先级相等，且栈顶运算符是左结合的 (非右结合)
            while (!ops.empty() && 
                   (getPrecedence(ops.top()) > getPrecedence(curOp) ||
                   (getPrecedence(ops.top()) == getPrecedence(curOp) && 
                    !isRightAssociative(curOp)))) {
                
                // 准备计算：弹出两个操作数和一个运算符
                int val2 = values.top(); values.pop();
                int val1 = values.top(); values.pop();
                char op = ops.top(); ops.pop();
                
                // 将计算结果压回操作数栈
                values.push(applyOperation(val1, val2, op));
            }
            // 将当前运算符压入栈
            ops.push(curOp);
        }
    }

    // 表达式遍历结束后，处理栈中剩余的运算符
    while (!ops.empty()) {
        int val2 = values.top(); values.pop();
        int val1 = values.top(); values.pop();
        char op = ops.top(); ops.pop();
        values.push(applyOperation(val1, val2, op));
    }

    // 栈中剩下的唯一元素就是最终结果
    return values.top();
}

int main() {
    // 测试用例 1
    vector expr1 = {"100", "+", "200", "/", "2", "*", "5", "+", "7"};
    cout << "结果 1: " << evaluateInfix(expr1) << endl; // 预期 607

    // 测试用例 2
    vector expr2 = {"2", "^", "3", "^", "2"};
    cout << "结果 2: " << evaluateInfix(expr2) << endl; // 预期 512

    return 0;
}

#### 深入代码逻辑

在 INLINECODEc50cd5b4 函数的核心 INLINECODEad3b5960 循环中，我们实现了一种“延迟处理”的策略。当你遇到一个新的运算符（比如 INLINECODE7579e4b5），而栈顶是一个高优先级的运算符（比如 INLINECODE7eba7107），这表示之前遇到的 INLINECODE26b6cffd 实际上应该先于这个 INLINECODE7596f998 执行。因此，我们不会急着压入 INLINECODE2d0a169f，而是先把栈顶的 INLINECODE2040ed0f 拿出来算掉。这种回溯机制正是双栈法的精髓。

C 语言实现细节

对于 C 语言开发者，由于没有 STL 容器，我们需要手动实现栈。虽然代码量稍大，但原理完全一致。以下是关键部分的实现思路。

#include 
#include 
#include 
#include 
#include 

#define MAX_LEN 100

// 简单的栈结构定义
typedef struct {
    int data[MAX_LEN];
    int top;
} IntStack;

typedef struct {
    char data[MAX_LEN];
    int top;
} CharStack;

void pushInt(IntStack *s, int val) { s->data[++s->top] = val; }
int popInt(IntStack *s) { return s->data[s->top--]; }
void pushChar(CharStack *s, char val) { s->data[++s->top] = val; }
char popChar(CharStack *s) { return s->data[s->top--]; }
int isEmptyInt(IntStack *s) { return s->top == -1; }
int isEmptyChar(CharStack *s) { return s->top == -1; }
int peekInt(IntStack *s) { return s->data[s->top]; }
char peekChar(CharStack *s) { return s->data[s->top]; }

// 运算逻辑与 C++ 版本相同
int applyOp(int a, int b, char op) {
    switch(op) {
        case ‘+‘: return a + b;
        case ‘-‘: return a - b;
        case ‘*‘: return a * b;
        case ‘/‘: 
            // 同样的地板除处理
            if (a * b < 0 && a % b != 0) return (a / b) - 1;
            return a / b;
        case '^': return (int)pow(a, b);
    }
    return 0;
}

// 优先级判断逻辑相同
int precedence(char op) {
    if (op == '+' || op == '-') return 1;
    if (op == '*' || op == '/') return 2;
    if (op == '^') return 3;
    return 0;
}

int evaluateInfixC(char* arr[], int n) {
    IntStack values; values.top = -1;
    CharStack ops; ops.top = -1;

    for (int i = 0; i  precedence(curOp) ||
                  (precedence(peekChar(&ops)) == precedence(curOp) && curOp != ‘^‘))) {
                  
                int val2 = popInt(&values);
                int val1 = popInt(&values);
                char op = popChar(&ops);
                pushInt(&values, applyOp(val1, val2, op));
            }
            pushChar(&ops, curOp);
        }
    }

    while (!isEmptyChar(&ops)) {
        int val2 = popInt(&values);
        int val1 = popInt(&values);
        char op = popChar(&ops);
        pushInt(&values, applyOp(val1, val2, op));
    }

    return peekInt(&values);
}

实际应用场景与性能优化

虽然我们在示例中处理的是整数数组，但在实际工业界中，这个算法的应用非常广泛。

公式引擎：Excel 或财务软件中的单元格计算。用户输入的公式（如 =SUM(A1*B1) + C1）本质上是中缀表达式。
数据库查询：SQL 的 WHERE 子句解析器通常会将比较运算符转换为表达式树，其底层逻辑与双栈法类似。
游戏脚本系统：许多游戏允许策划配置伤害公式，这就需要运行时动态解析字符串表达式。

性能优化建议：

空间优化：虽然空间复杂度是 $O(N)$，但在某些特定情况下（如只有左结合的运算符），我们可以使用一个栈来存储操作数和运算符的混合形式，但这会大大增加代码的复杂度，双栈法在工程上通常是更好的选择。
预处理：如果你的输入是原始字符串（如 "10 + 20"）而不是分割好的数组，那么词法分析（将字符串分割成 tokens）实际上可能占用不少时间。使用高效的字符串流或指针遍历进行 tokenization 是关键。
异常处理：在上面的代码中，我们假设输入总是合法的。但在生产环境中，你必须检查栈是否为空（在 pop 前）以及分母是否为零。

常见陷阱与调试技巧

在实现这一算法时，新手最容易犯的错误包括：

操作数顺序：在弹出操作数计算时，是 INLINECODE93c51f25 还是 INLINECODEd2ec0e7e？

* 由于栈是后进先出（LIFO），对于减法和除法，先弹出来的是第二个操作数。例如计算 INLINECODE8ad6266b，栈顶是 3。所以代码必须是 INLINECODE618f8c98，其中 INLINECODEb9143954 是先弹出的数（作为被减数），INLINECODE58cd4865 是后弹出的数（作为减数）。请务必注意：上面的代码示例中，INLINECODE3e06f495 是 INLINECODE3119fbb4 (先弹出)，INLINECODE1097b740 是第二次弹出。 代码中 INLINECODEd8160762 的顺序取决于你的栈弹出顺序。在我们的示例代码中，我们确保了 INLINECODE5f1061f1 是左操作数（先入栈），INLINECODE0b1e37fa 是右操作数（后入栈），计算时注意这一点。

修正说明*：在栈中，对于 INLINECODE368660ef，A 先入栈，B 后入栈。弹出时，B 先出，A 后出。所以计算是 INLINECODEfa5c1b68。在代码中，如果 INLINECODE16612f14 (即B)，INLINECODE7c6eef6a (即A)，那么计算应为 val1 - val2。请务必仔细检查你的代码逻辑。

地板除的边界情况：

* 在 C++ 中，INLINECODEb188654c。但在某些题目要求的“向下取整”中，结果应为 INLINECODE8e6b8b08。这一个小小的逻辑错误可能导致通过率从 100% 掉到 0%。

总结

通过使用双栈法，我们将一个看似复杂的解析问题转化为了简单的线性扫描问题。这种方法不仅时间复杂度为 $O(N)$（每个元素最多被压入和弹出栈各一次），而且逻辑清晰，易于扩展（例如添加一元运算符或函数调用）。

掌握这一算法，你就掌握了处理基于规则的计算系统的金钥匙。下次当你需要在代码中解析用户输入的公式时，不妨亲手实现一下这个逻辑，感受算法之美。

希望这篇深入的解析对你有所帮助。继续编码，继续探索！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客