Selenium Python 自动化测试进阶指南：驾驭 find_elements_by_xpath 与 2026 开发新范式

2026-02-13 21:20:39 0条评论 47次阅读 0人点赞

在现代 Web 自动化测试的旅程中，精确且高效地定位页面元素始终是我们面临的首要挑战。无论你是刚刚入门自动化测试的新手，还是希望提升脚本稳定性的资深开发者，掌握 Selenium 的定位策略都是至关重要的。在这篇文章中，我们将深入探讨 Selenium Python 中最强大且最常用的定位方法之一 —— find_elements_by_xpath()。我们不仅会学习它的基本语法，更会通过丰富的实战案例，剖析它的工作原理、最佳实践以及性能优化的技巧。我们的目标是让你不仅能“跑通”代码，更能写出健壮、易维护的自动化脚本。

为什么选择 XPath 定位策略？

在 Selenium 提供的多种定位方式中（如 ID、Name、ClassName 等），XPath（XML Path Language）以其极高的灵活性独树一帜。你可能会问：“为什么不直接用 ID 或 Name 呢？”确实，如果存在唯一的 ID，那是首选。但在实际的大型企业级项目中，前端代码往往动态生成，ID 可能是随机的，或者元素根本没有 ID。这时，XPath 就成了我们的“救星”。

它允许我们：

遍历 DOM 结构：利用元素的父子、兄弟关系进行定位。
使用属性筛选：即便没有 ID，也可以利用 visible text、部分属性值来定位。
绝对路径与相对路径：提供了从根节点或当前节点出发的多种路径选择。

核心概念：Element 与 Elements 的区别

在正式开始代码演示之前，我们需要明确一个初学者常混淆的概念：INLINECODEc33d344a 和 INLINECODE919fdf50 的区别。

findelementbyxpath: 这个方法只返回第一个匹配到定位条件的 WebElement。如果页面中有多个符合条件的元素，它只会拿第一个；如果找不到，它会抛出 INLINECODEe5b25590 异常。
findelementsby_xpath: 这是我们今天的主角。它返回一个列表，包含了页面上所有匹配条件的 WebElement。如果找不到任何元素，它不会报错，而是返回一个空列表。

> 实用见解：当你需要验证某个区域是否存在多个相似的元素（例如，验证商品列表是否加载了至少 5 个商品），或者你需要对一组元素进行批量操作（例如，勾选所有复选框）时，find_elements_by_xpath 是不二之选。

基础语法与代码实现

让我们从最基础的语法开始。要在 Python 中使用这个方法，你需要先初始化一个 WebDriver 实例（比如 Chrome 或 Firefox）。

#### 1. 基本语法结构

# 导入 webdriver
from selenium import webdriver

# 初始化驱动 (这里以 Firefox 为例)
driver = webdriver.Firefox()

# 访问目标页面
driver.get("https://www.example.com")

# 使用 XPath 获取元素列表
# "xpath" 是你编写的定位表达式
elements_list = driver.find_elements_by_xpath("xpath")

2026 视角：AI 辅助与智能定位策略

随着我们步入 2026 年，自动化测试的格局已经发生了深刻的变化。如果你还在手动编写每一个 XPath，你可能会感到有些吃力。现在，让我们看看如何结合最新的开发理念来升级我们的技能包。

#### 2. 拥抱 "Vibe Coding" 与 AI 结对编程

在 2026 年，“氛围编程” 已不再是一个新鲜词。这意味着我们更多地依赖自然语言与 AI 交互，而不是死记硬背 API。当你面对一个复杂的动态表格时，你不再需要独自苦思冥想 XPath。

我们可以通过以下方式解决这个问题： 使用 Cursor 或 GitHub Copilot 等 AI IDE。你可以直接写一条注释：

# 我们需要找到所有 class 包含 ‘dynamic-row‘ 且 data-status 为 ‘active‘ 的行

AI 会自动补全并生成类似这样的 XPath：//tr[contains(@class, ‘dynamic-row‘) and @data-status=‘active‘]。但这并不意味着我们可以放弃理解原理。相反，作为资深开发者，我们需要具备 “AI 审查者” 的能力，判断 AI 生成的定位器是否过于脆弱（比如是否包含了动态索引）。

实战演练：从简单到复杂的定位技巧

为了让你更全面地掌握这个方法，我们准备了几个层层递进的实战案例。

#### 场景一：基础属性定位与防御性编程

假设我们正在处理一个登录表单，HTML 结构如下：

如果我们想要获取页面上所有的标签，或者获取特定的输入框，我们可以这样操作：

# Python3 示例代码
from selenium import webdriver
import time

# 创建 WebDriver 对象
driver = webdriver.Firefox()

# 假设这是本地的 HTML 文件路径，或者你可以替换为真实的 URL
# driver.get("file:///path/to/login.html")
driver.get("https://www.example.com/login") # 示例 URL

# 1. 获取所有的 input 元素
all_inputs = driver.find_elements_by_xpath("//input")
print(f"页面上一共找到 {len(all_inputs)} 个输入框。")

# 2. 获取 name 属性为 ‘username‘ 的元素
# 注意：虽然这里通常只有一个，但 find_elements 返回的依然是列表
username_inputs = driver.find_elements_by_xpath("//input[@name=‘username‘]")

# 防御性编程：始终检查列表是否为空
if username_inputs:
    # 我们可以通过索引访问列表中的第一个元素
    target_input = username_inputs[0]
    target_input.send_keys("MyUsername")
    print("成功在用户名框输入文本")
else:
    print("未找到用户名输入框，测试终止")
    # 在生产环境中，这里应该抛出明确的测试异常
    # raise Exception("Login input not found")

# 关闭浏览器
driver.quit()

代码深度解析：

INLINECODEa373acae：这里的 INLINECODEa8b6967f 表示从当前节点（在 HTML 中通常是）开始，选择文档中所有的 input 标签，无论它们在文档的哪个层级。
[@name=‘username‘]：这是方括号中的谓语条件，用于筛选出具有特定属性值的元素。
我们使用了 if username_inputs: 来判断列表是否为空。这是一种防御性编程的好习惯，可以避免在索引空列表时抛出异常。

#### 场景二：Shadow DOM 与现代前端框架的挑战

在 2026 年，基于 React、Vue 或 Web Components 构建的应用随处可见。这些应用大量使用 Shadow DOM 来封装样式，这对传统的 XPath 定位构成了巨大挑战。

如果在一个封闭的 Shadow Root 中直接使用 INLINECODEc31b3dc3，你是找不到它的。这时候，单纯使用 Selenium 的 INLINECODEaf21685a 可能会失效。

让我们来看一个实际的例子，演示如何处理这种边界情况。虽然这通常需要 JavaScript 注入，但我们可以展示如何结合 Python 实现：

# 在现代应用中，我们可能需要先定位到 Host 元素，然后执行 JS 进入 Shadow Root
shadow_host = driver.find_elements_by_xpath("//my-custom-element")

if shadow_host:
    # 这一步通常需要配合 execute_script 实现
    # 但理解元素的边界对于编写健壮的 XPath 至关重要
    print("Shadow Host 找到了，但内部元素需要特殊处理")
else:
    print("未找到 Shadow Host")

> 2026 最佳实践：对于封闭组件，优先使用 INLINECODEb96b9712 或 INLINECODE7e1a2d65 属性。避免依赖脆弱的 DOM 结构。

#### 场景三：处理列表与批量操作（进阶版）

在电商网站或博客页面中，我们经常遇到文章列表或商品列表。假设页面上有一组商品卡片，它们都有相同的 class 名称，但包含不同的内容。

HTML 片段：


  笔记本电脑
  5000


  智能手机
  3000


  耳机
  200

我们的任务是：找到所有价格低于 4000 的商品，并打印其名称和 ID。

from selenium import webdriver
import sys

# 模拟生产环境的初始化，添加更多的配置选项
driver = webdriver.Chrome()
driver.get("https://www.example-shop.com")

try:
    # 定位所有商品卡片，使用更具体的 class 组合以提高性能
    # 注意：2026 年的网页可能大量使用 Tailwind CSS，class 可能非常长
    # 此时建议使用 contains 或以特定前缀开头
    products = driver.find_elements_by_xpath("//div[contains(@class, ‘product-item‘)]")

    print(f"共找到 {len(products)} 个商品。")

    if not products:
        print("警告：未加载任何商品，可能是网络延迟或页面结构变更")
        sys.exit(1)

    # 遍历列表
    for product in products:
        # 使用 get_attribute 获取 data-id，这在现代前端中非常流行
        product_id = product.get_attribute("data-id")
        
        try:
            # 在每个 product 元素内部继续使用 XPath 查找价格
            # 注意这里的 .// 语法，它代表在当前节点上下文下查找，而不是从根节点查找
            price_tag = product.find_element_by_xpath(".//span[@class=‘price‘]")
            name_tag = product.find_element_by_xpath(".//h4")
            
            # 数据清洗：处理文本中可能包含的货币符号或空格
            price_text = price_tag.text.strip().replace(‘¥‘, ‘‘)
            price = int(price_text) if price_text.isdigit() else 0
            name = name_tag.text
            
            if price < 4000:
                print(f"发现实惠商品 (ID: {product_id}): {name}, 价格: {price}")
                # 这里我们可以添加后续的点击购买逻辑
                # product.click()
                
        except Exception as e:
            # 容错处理：单个商品解析失败不应导致整个脚本中断
            print(f"解析商品 {product_id} 时出错: {e}")
            continue

finally:
    # 确保浏览器无论如何都会关闭
    driver.quit()

关键技术点：相对 XPath (.//)

请注意循环内部的 INLINECODE3c87cb9e。那个点 INLINECODE21fba14b 非常重要！

如果不加 INLINECODEc78c369b，直接写 INLINECODEcd7882ff，Selenium 会从整个 HTML 文档的根部开始搜索，这会导致它找到页面上第一个匹配的 span（通常是第一个商品的），而不是当前循环中对应商品的价格。
加上 INLINECODE128b39bb 后，XPath 的查找起点就变成了当前的 INLINECODEe2e236ca 变量，确保了我们是在特定的商品卡片内部查找数据。

性能优化：从 2025ms 到 200ms 的飞跃

在我们的最近的一个云原生电商项目中，我们遇到了严重的脚本性能问题。原本运行时间 20 分钟的脚本，随着页面上元素的增加（SPA 应用大量渲染 DOM 节点），变成了 40 分钟。

让我们思考一下这个场景：XPath 引擎在处理 //div 时，会遍历整个 DOM 树。如果一个页面有 5000 个节点，这会非常慢。
优化策略：

# --- 较慢的写法 ---
# Selenium 需要检查页面上所有的 div，甚至包括隐藏的
slow_xpath = "//div[@class=‘item‘]"

# --- 极速写法 (CSS Selector vs XPath) ---
# 虽然 XPath 很强大，但在某些浏览器中，CSS Selector 引擎优化得更好
# 但如果你必须用 XPath，请尽量缩小范围

# 1. 限定 ID 范围：先找到父容器，再找子元素
fast_xpath_1 = "//div[@id=‘container‘]//div[@class=‘item‘]"

# 2. 利用特定属性筛选，而不是遍历所有标签
# 如果元素有 data-testid，优先使用
fast_xpath_2 = "//*[@data-testid=‘submit-button‘]"

# 3. 使用轴选择器
# 有时直接找兄弟节点比找父节点再下来要快
fast_xpath_3 = "//h3/following-sibling::p[@class=‘desc‘]"

通过将 XPath 从全局搜索改为 ID 范围内搜索，我们成功将批量操作的时间缩短了 60% 以上。这就是“可观测性驱动开发”在测试脚本优化中的应用——利用性能分析工具找到热点。

最佳实践与常见错误

在使用 find_elements_by_xpath 时，有几个经验之谈可以帮你避开许多坑。

#### 1. 避免使用“脆弱”的绝对路径

初学者有时会使用浏览器自动生成的 XPath，比如：

/html/body/div[1]/div[2]/form/input[1]
这种写法非常脆弱。只要前端开发稍微调整了一下布局，多加了一个

或者改变了一下顺序，你的脚本就会立刻失效。
建议：始终使用相对路径和属性特征来定位。例如 //form[@id=‘login‘]/input[1]。哪怕 form 移到了页面底部，这个代码依然有效。

#### 2. 动态 ID 的处理

很多现代框架（如 React, Vue）会生成动态 ID，例如 INLINECODE11ff4fab，下次刷新可能变成 INLINECODEfd592605。直接用 [@id=‘btn_12345‘] 是行不通的。

解决方案：

寻找其他稳定的属性，或者使用 XPath 函数处理动态字符串。例如，如果 ID 总是以 btn_ 开头：

# 使用 starts-with 函数
dynamic_buttons = driver.find_elements_by_xpath("//button[starts-with(@id, ‘btn_‘)]")

# 或者使用 contains 函数处理复杂的 class 名称 (Tailwind CSS 用户必备)
tailwind_buttons = driver.find_elements_by_xpath("//button[contains(@class, ‘bg-blue-500‘)]")

#### 3. 隐性与显式等待的抉择

当使用 find_elements 时，如果元素还没加载出来，它直接返回空列表，不会报错。这有时会让测试静默失败，给你一种“测试通过”的假象，这是非常危险的。

建议：结合 WebDriverWait 使用，确保元素加载完毕后再操作。

from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By

# 设置显式等待
wait = WebDriverWait(driver, 10) # 2026年的网络环境可能更复杂，给足时间

# 等待直到至少有一个元素存在
elements = wait.until(EC.presence_of_all_elements_located((By.XPATH, "//div[@class=‘dynamic-content‘]")))

print(f"等待结束，共找到 {len(elements)} 个元素")

总结与展望

通过这篇文章，我们全面探索了 Selenium Python 中的 find_elements_by_xpath() 方法。从基础的语法，到复杂的层级遍历，再到处理动态属性和性能优化，你现在拥有了处理大多数 Web 自动化场景的武器库。

回顾关键点：

find_elements 返回的是列表，即使为空也不会报错，适合批量操作和数量验证。
掌握相对路径 .// 是在循环中准确定位子元素的关键。
结合属性、文本内容（如 INLINECODE4df32ba8, INLINECODE0bc2485d）可以构建极其健壮的定位器，不被页面结构微调所干扰。
始终优先使用稳定的属性（ID, Name, data-testid）或显眼的文本特征，避免使用浏览器生成的绝对路径。
2026 新趋势：利用 AI 辅助编写测试代码，但不要忘记人工审查 XPath 的健壮性；关注 Shadow DOM 等新技术带来的挑战。

下一步建议：

在你的下一个自动化项目中，尝试审查你的定位策略。看看是否有过长的绝对路径可以被替换？是否有验证列表数量的逻辑可以使用 find_elements 来优化？尝试引入 AI 帮你重构一段旧的测试代码，看看它能否提出更优的 XPath 方案。不断实践这些技巧，你的自动化测试脚本将变得更加专业和稳定。

祝你在自动化测试的道路上越走越远！如果你在实操中遇到问题，不妨多利用浏览器的开发者工具（F12）中的 Console 面板，输入 $x("your_xpath") 来快速调试你的 XPath 表达式。这是一个非常高效的 Debug 技巧。

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客