深入解析人工智能中的有信息搜索算法：从贪婪最佳优先到A*搜索

2026-02-16 01:06:49 0条评论 2次阅读 0人点赞

在人工智能和计算机科学领域，搜索算法是解决寻路问题的核心。作为开发者，我们经常需要在一个巨大的可能性空间中找到从起点到终点的最优路径。你可能听说过“无信息搜索”（如广度优先或深度优先搜索），它们像无头苍蝇一样盲目探索，直到碰到目标。但在现实世界的复杂应用中，这种方式往往效率太低。

这时候，我们就需要引入更聪明的策略——“有信息搜索算法”。在这篇文章中，我们将深入探讨这一领域，通过实际代码和详细解析，带你理解如何利用“启发式”知识让我们的程序像经验丰富的探险家一样，高效地找到目标。

什么是有信息搜索？

简单来说，有信息搜索算法利用额外的信息（称为启发式函数）来指导搜索过程。想象一下，你在迷宫中找出口，如果你知道出口大致在东北方向（这就是启发式信息），你肯定不会选择向南的路径。这些算法通过估算每个节点距离目标还有多远，从而优先探索最有希望的路径。这不仅大大提高了搜索速度，还能让我们更接近最优解。

为了让你更直观地理解，我们将使用一个经典的迷宫网格示例。在这个网格中，INLINECODE4bce953f 代表可通行的路径，INLINECODEf0cf2af3 代表墙壁。我们的目标是从左上角 INLINECODEcf2580c9 找到右下角 INLINECODEe2b7ecb8 的最佳路径。

# 定义我们的迷宫环境
# 0 = 平地, 1 = 障碍物
maze = [
    [0, 0, 0, 0, 1],
    [0, 1, 1, 0, 1],
    [0, 0, 0, 0, 0],
    [0, 1, 0, 1, 0],
    [0, 0, 0, 0, 0],
]
start = (0, 0)
end = (4, 4)

1. 贪婪最佳优先搜索

首先，让我们认识一种非常直观但也非常“急躁”的算法——贪婪最佳优先搜索。

#### 工作原理

正如其名，这个算法非常“贪婪”。它在每一步都只看眼前：“离目标最近的那个邻居是哪一个？” 它完全依赖于启发式函数 h(n)（通常是曼哈顿距离或欧几里得距离）来做决定，而完全忽略了我们已经走了多远。

优点：实现简单，如果运气好，它的速度极快，能迅速逼近目标。
局限性：正如我们在生活中见到的短视行为一样，它容易被眼前的利益欺骗，陷入死胡同，或者绕远路。它不保证找到最短路径。

#### 代码实战

在下面的代码中，我们将使用 Python 的 heapq 模块来实现一个优先队列。这能确保我们每次弹出的都是当前看来离目标最近的节点。

import heapq

# 计算曼哈顿距离作为我们的启发式估算
def heuristic(a, b):
    return abs(a[0] - b[0]) + abs(a[1] - b[1])

def greedy_best_first_search(maze, start, end):
    # open_list 存储待探索的节点，格式为：(优先级, 当前坐标)
    # 优先级由启发式函数决定，越小越好
    open_list = []
    heapq.heappush(open_list, (heuristic(start, end), start))
    
    came_from = {start: None} # 用于回溯路径
    visited = set()           # 避免重复访问
    
    # 定义四个移动方向：右、下、左、上
    directions = [(0, 1), (1, 0), (0, -1), (-1, 0)]

    while open_list:
        _, current = heapq.heappop(open_list)

        # 如果找到目标，开始重构路径
        if current == end:
            path = []
            while current:
                path.append(current)
                current = came_from[current]
            return path[::-1] # 反转列表，从起点到终点
        
        visited.add(current)

        # 遍历所有可能的邻居
        for dx, dy in directions:
            neighbor = (current[0] + dx, current[1] + dy)
            
            # 检查边界、墙壁和访问状态
            if (0 <= neighbor[0] < len(maze) and 0 <= neighbor[1] < len(maze[0]) and
                    maze[neighbor[0]][neighbor[1]] == 0 and neighbor not in visited):
                
                visited.add(neighbor)
                came_from[neighbor] = current
                # 关键：只根据启发式估值决定优先级
                heapq.heappush(open_list, (heuristic(neighbor, end), neighbor))
    return None # 未找到路径

# 运行算法
path = greedy_best_first_search(maze, start, end)
print("Greedy Best-First 路径:", path)

输出：

Greedy Best-First 路径: [(0, 0), (0, 1), (0, 2), (0, 3), (1, 3), (2, 3), (2, 4), (3, 4), (4, 4)]

#### 代码解析

你可以看到，算法为了尽快“靠近”目标，不惜沿着边缘走到尽头。虽然它成功到达了，但在更复杂的地图中，这种策略可能会导致它走进一个无法回头的死胡同，从而被迫回溯，甚至失败。

2. A* (A-Star) 搜索算法

既然贪婪搜索太短视，我们能不能找个平衡点？这就是 A* 算法诞生的原因。它可以说是游戏开发和路径规划中最著名的算法之一。

#### 工作原理

A* 算法不仅考虑“距离目标还有多远”（启发式 INLINECODE8be55bb5），还考虑“我们已经走了多远”（实际代价 INLINECODE4240a174）。它的评估函数是：

f(n) = g(n) + h(n)

g(n)：从起点到当前节点的实际步数。
h(n)：从当前节点到目标的估算距离。

这种组合让 A 既不会像贪婪算法那样盲目冲刺，也不会像 Dijkstra 算法那样向所有方向平均扩散。只要我们的启发式函数是“可采纳的”（即永远不会高估实际距离），A 就保证能找到最短路径。

优点：完美平衡了速度和准确性，保证找到最短路径。
局限性：需要维护更多的数据结构，内存消耗略高于贪婪算法。

#### 代码实战

注意看代码中 cost_so_far 的使用，这是 A* 能够找到最优解的关键。

def a_star_search(maze, start, end):
    open_list = []
    # 优先级 f = g + h，初始时 g=0
    heapq.heappush(open_list, (0 + heuristic(start, end), 0, start))
    
    came_from = {start: None}
    cost_so_far = {start: 0} # 记录到达每个节点的最小代价
    directions = [(0, 1), (1, 0), (0, -1), (-1, 0)]

    while open_list:
        _, current_cost, current = heapq.heappop(open_list)

        # 如果找到目标，直接返回（第一次找到的一定是最优的）
        if current == end:
            path = []
            while current:
                path.append(current)
                current = came_from[current]
            return path[::-1]

        # 探索邻居
        for dx, dy in directions:
            neighbor = (current[0] + dx, current[1] + dy)
            
            # 边界与障碍检查
            if (0 <= neighbor[0] < len(maze) and 0 <= neighbor[1] < len(maze[0]) and
                    maze[neighbor[0]][neighbor[1]] == 0):
                
                new_cost = cost_so_far[current] + 1 # 每步代价设为 1
                
                # 核心优化：如果发现更便宜的路到达邻居，或者是第一次访问
                if neighbor not in cost_so_far or new_cost < cost_so_far[neighbor]:
                    cost_so_far[neighbor] = new_cost
                    priority = new_cost + heuristic(neighbor, end)
                    heapq.heappush(open_list, (priority, new_cost, neighbor))
                    came_from[neighbor] = current
    return None

# 运行 A*
path_a_star = a_star_search(maze, start, end)
print("A* 最短路径:", path_a_star)

输出：

A* 最短路径: [(0, 0), (1, 0), (2, 0), (2, 1), (2, 2), (2, 3), (2, 4), (3, 4), (4, 4)]

#### 深入比较

如果你仔细观察两个输出的路径，你会发现贪婪算法倾向于紧贴顶部墙壁走，而 A 算法选择了更“中心”的路线（向下绕行）。这是因为 A 权衡了“已经走过的路”和“剩下的路”，避免了为了接近目标而付出过多的实际步数代价。

3. 进阶：Dijkstra 算法（作为 A* 的特殊情况）

在深入学习 A 时，我们必须要提到它的“老大哥”——Dijkstra 算法。有趣的是，Dijkstra 算法其实就是 A 算法的一种特殊情况——当你把启发式函数 h(n) 强制设为 0 时。

#### 为什么我们要提到它？

有时候，我们根本不知道目标在哪里，或者无法给目标位置一个合理的估算（例如：在一个没有地图的无限迷宫中探索）。这时，Dijkstra 算法就像一个尽职尽责的扫描仪，它会以起点为中心，像水波纹一样向四周均匀扩散，直到找到目标。它保证能找到最短路径，但通常比 A* 探索更多的节点。

#### 代码实现

让我们看看如何通过微调 A* 来实现 Dijkstra。代码逻辑几乎完全一样，唯一的区别在于优先级的计算方式。

def dijkstra_search(maze, start, end):
    open_list = []
    # 注意：这里不使用 heuristic，优先级完全取决于 cost_so_far
    heapq.heappush(open_list, (0, start))
    
    came_from = {start: None}
    cost_so_far = {start: 0}
    directions = [(0, 1), (1, 0), (0, -1), (-1, 0)]

    while open_list:
        current_cost, current = heapq.heappop(open_list)

        # 找到目标
        if current == end:
            path = []
            while current:
                path.append(current)
                current = came_from[current]
            return path[::-1]

        for dx, dy in directions:
            neighbor = (current[0] + dx, current[1] + dy)
            if (0 <= neighbor[0] < len(maze) and 0 <= neighbor[1] < len(maze[0]) and
                    maze[neighbor[0]][neighbor[1]] == 0):
                
                new_cost = cost_so_far[current] + 1
                
                if neighbor not in cost_so_far or new_cost < cost_so_far[neighbor]:
                    cost_so_far[neighbor] = new_cost
                    heapq.heappush(open_list, (new_cost, neighbor))
                    came_from[neighbor] = current
                    
    return None

path_dijkstra = dijkstra_search(maze, start, end)
print("Dijkstra 最短路径:", path_dijkstra)

性能对比与最佳实践

让我们在实际运行中比较一下这三种算法的表现。

搜索范围（节点访问数）：

* 贪婪搜索：访问的节点最少。它只盯着目标走，完全不关心沿途的风景。效率最高，但风险最大（容易走错路）。

* Dijkstra：访问的节点最多。它会向四面八方探索，直到撞到目标。最稳妥，但速度最慢。

A 搜索：访问的节点介于两者之间。它在“盲目搜索”和“直扑目标”之间找到了完美的平衡点。只要启发式函数设计得当，它就是最快的“最优路径”查找器。

如何选择启发式函数？

你可能会问：“我该怎么写 heuristic(a, b) 函数？” 这是一个关键问题。

* 曼哈顿距离：适用于只能上下左右移动的网格（如我们的迷宫示例）。计算公式：|x1 - x2| + |y1 - y2|。

* 欧几里得距离：适用于可以在任意角度移动的平面（如游戏中的角色直线移动）。计算公式：两点间的直线距离。

* 切比雪夫距离：适用于允许对角线移动的网格。

提示：启发式函数必须满足“可采纳性”（即估计值 ≤ 实际值），否则 A* 将无法保证找到最短路径。

常见错误与调试技巧

在你自己实现这些算法时，可能会遇到一些坑。这里有一些我们的经验之谈：

死循环问题：在编写 A* 或贪婪搜索时，最常见的问题是忘记维护 INLINECODE3d92316f 集合或 INLINECODE764e8720 字典。如果不检查，你的算法可能会在两个格子之间反复横跳，导致内存溢出。记住：永远不要把同一个节点重复加入队列，除非你发现了一条更便宜的路径。
T型优先队列：Python 的 heapq 在比较元组时，如果第一个元素（如优先级）相同，它会尝试比较第二个元素（如节点坐标）。在我们的代码中，我们在堆里加了中间变量（如 cost），这能防止直接比较坐标元组可能引发的错误。
启发式过度估计：如果你发现 A* 找到的路径比预期的长，或者和贪婪搜索一样快但路径很怪，检查一下你的启发式函数。你可能把距离估算得太大了，导致算法“过度自信”地走捷径。

总结与展望

在这篇文章中，我们一起穿越了迷宫，探索了人工智能中有信息搜索算法的奥秘。

我们从贪婪最佳优先搜索中学到了“快”的代价，以及纯粹依赖直觉的风险。

我们通过A 算法体会到了平衡“已知”与“未知”的智慧，它是寻找最优路径的黄金标准。

最后，我们通过Dijkstra 算法理解了基础原理的重要性，它是我们在没有地图时的最佳依靠。

下一步建议：

现在你可以尝试修改这些代码，看看会发生什么。比如，试着将迷宫扩大到 100×100，并在其中随机放置障碍物。你会发现 A* 算法在处理大型复杂空间时，比无信息搜索快了成千上万倍。你还可以尝试改变权重（例如 f(n) = g(n) * 1.2 + h(n)），这在游戏 AI 中常用于模拟不同性格的角色（有的更倾向于走大路，有的则喜欢抄近道）。

掌握这些算法，将为你解决更复杂的问题（如神经网络的路径规划、自动驾驶车辆的导航系统）打下坚实的基础。希望你在代码的世界里玩得开心！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客