如何使用 WebDriver 在 Chrome 浏览器上运行 Selenium 自动化测试：从入门到实战

2026-02-13 15:15:33 0条评论 4次阅读 0人点赞

你好！作为一名在自动化测试领域摸爬滚打多年，见证了从简单的脚本录制到如今 AI 辅助测试时代的开发者，我深知刚开始接触 Selenium WebDriver 时那种既兴奋又略显困惑的心情。自动化测试不仅能帮我们节省大量的重复劳动，更是现代持续集成/持续部署（CI/CD）流水线中不可或缺的守护者。

今天，我们将以 2026 年的视角，重新探讨这个经典话题：如何一步步搭建环境，并使用 Selenium WebDriver 在 Chrome 浏览器上运行我们的第一个自动化测试脚本。在这篇文章中，我们将深入探讨每一个细节，从环境配置到代码编写，再到如何处理实际开发中可能遇到的坑，以及如何利用现代工具链提升效率。

1 为什么选择 Selenium 和 Chrome？
2 准备工作：搭建现代开发环境
3 核心步骤：在 Chrome 上运行测试（2026 精简版）
4 2026 技术趋势融合：AI 与云原生测试
5 常见陷阱与故障排查指南
6 总结与下一步

为什么选择 Selenium 和 Chrome？

在开始动手之前，让我们先明确一下我们手中的工具。Selenium 依然是业界最强大的开源 Web 自动化测试框架之一，它就像是一个万能的“机器人”，能够模拟人类用户在浏览器上的操作——点击、输入、滚动页面等等。即使在 2026 年，面对复杂的单页应用（SPA）和动态内容，Selenium 依然是首选。

而 ChromeDriver，则是连接 Selenium 和 Chrome 浏览器的桥梁。你可能会有疑问：为什么我们不能直接控制浏览器？这就好比你想开车，但你需要一把钥匙（ChromeDriver）来启动引擎。ChromeDriver 实现了 WebDriver 标准协议（W3C WebDriver），它允许我们的测试代码通过 HTTP 请求向浏览器发送指令。

准备工作：搭建现代开发环境

为了确保后续的步骤顺利进行，我们需要先把“地基”打好。我们将使用 Java 作为编程语言，并推荐使用 IntelliJ IDEA 作为集成开发环境（IDE），因为它对现代开发工具链的支持更为出色。

1. 安装 Java 开发工具包 (JDK)

Selenium WebDriver 的原生支持语言之一就是 Java。我们需要确保你的机器上安装了 JDK。

推荐版本：建议使用 JDK 17 或 JDK 21（LTS 版本），这些版本在性能和稳定性上都有巨大提升。
验证安装：安装完成后，打开命令提示符或终端，输入以下命令。如果看到了版本号，恭喜你，第一步完成了！

java -version

2. 选择你的武器：IDE 与 AI 助手

虽然 Eclipse 是经典，但在 2026 年，我们更推荐使用 IntelliJ IDEA Community Edition 或 Cursor、Windsurf 等支持 AI 辅助的编辑器。

AI 辅助编程：在我们的实际工作流中，现在不仅仅是编写代码，更是与 AI 结对编程。比如，当我们忘记某个 API 的具体用法时，我们可以直接询问 IDE 中的 Copilot 或 ChatGPT 插件：“如何在 Selenium 中处理 Shadow DOM？”它能直接生成代码片段。这种“氛围编程”极大地提升了我们的效率。

3. 依赖管理革命：告别手动 JAR 包

在过去，我们需要手动下载 Selenium JAR 包并配置 Build Path。但在 2026 年，这是一种过时的做法。我们强烈推荐使用构建工具。

Maven 或 Gradle：这是 Java 生态的标准。通过简单的配置，构建工具会自动从中央仓库下载 Selenium 及其所有依赖项。
示例 Maven 依赖：


    org.seleniumhq.selenium
    selenium-java
    4.27.0

这样做的好处是，当 Selenium 发布新版本或修复 Bug 时，我们只需要修改一个版本号，而不是手动去替换几十个 JAR 文件。

核心步骤：在 Chrome 上运行测试（2026 精简版）

好了，环境准备就绪。现在让我们进入正题。随着 Selenium 4 的成熟和浏览器管理工具的进化，许多步骤已经被简化了。

步骤 1：驱动程序管理的自动化

这是新手最容易卡住的地方。过去，我们需要去 Chrome for Testing 页面手动下载 chromedriver.exe。如果浏览器版本和驱动版本不匹配，测试就会直接报错。这简直是噩梦。

2026 年的最佳实践：我们不再手动管理驱动。我们将使用 WebDriverManager（在 Java 中）或 Selenium 自带的 Selenium Manager。

让我们来看一段代码，展示如何通过 Selenium Manager 自动管理驱动，无需任何手动配置。

#### 示例 1：自动化驱动管理与基础启动

这段代码展示了如何在不手动设置 System.setProperty 的情况下启动浏览器。Selenium 4+ 会自动检测你的浏览器版本并下载匹配的驱动。

import org.openqa.selenium.WebDriver;
import org.openqa.selenium.chrome.ChromeDriver;
import org.openqa.selenium.chrome.ChromeOptions;

public class ModernSeleniumTest {
    public static void main(String[] args) {
        // 1. 配置浏览器选项
        // 即使在自动化测试中，我们也建议设置一些选项以提高稳定性
        ChromeOptions options = new ChromeOptions();
        // 添加一些参数，例如忽略自动化控制提示（这是 2026 年常见的做法，防止网站检测到你是机器人）
        options.addArguments("--disable-blink-features=AutomationControlled");
        options.addArguments("--start-maximized");

        // 2. 实例化 ChromeDriver 对象
        // 注意：我们不再需要 System.setProperty("webdriver.chrome.driver", "path")！
        // Selenium Manager 会在后台默默处理一切。
        WebDriver driver = new ChromeDriver(options);

        try {
            // 3. 导航到目标网站
            driver.get("https://www.geeksforgeeks.org");

            // 4. 验证页面标题
            String title = driver.getTitle();
            System.out.println("页面标题是: " + title);
            
            if (title.contains("GeeksforGeeks")) {
                System.out.println("测试通过：成功访问 GeeksforGeeks！");
            }

        } finally {
            // 5. 清理资源：无论测试成功与否，都要关闭浏览器
            // 这能防止僵尸进程占用你的内存
            driver.quit();
        }
    }
}

深度解析：

Selenium Manager：这是 Selenium 4.6+ 引入的革命性功能。它消除了“驱动版本不匹配”这个最常见的新手错误。在我们的项目中，自从引入了这个机制，环境配置的时间从 30 分钟缩短到了 1 分钟。
Options 配置：你会发现我们添加了 --disable-blink-features=AutomationControlled。在 2026 年，越来越多的网站使用 Bot 检测技术来防止爬虫。这个参数可以帮助我们的测试脚本伪装成真实用户，避免被网站拦截。

步骤 2：智能交互与显式等待

仅仅打开浏览器是不够的。现代 Web 应用充斥着 AJAX、Vue.js 或 React 动态渲染。使用 Thread.sleep()（硬性等待）是绝对禁止的反模式，因为它会让测试变得极慢且不稳定。

让我们来看一个更高级的例子，模拟用户在 GeeksforGeeks 上搜索文章，并使用 显式等待 来处理动态加载。

#### 示例 2：生产级的交互代码

import org.openqa.selenium.By;
import org.openqa.selenium.Keys;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.chrome.ChromeDriver;
import org.openqa.selenium.chrome.ChromeOptions;
import org.openqa.selenium.support.ui.ExpectedConditions;
import org.openqa.selenium.support.ui.WebDriverWait;
import java.time.Duration;

public class AdvancedInteractionTest {
    public static void main(String[] args) {
        ChromeOptions options = new ChromeOptions();
        options.addArguments("--disable-blink-features=AutomationControlled");
        WebDriver driver = new ChromeDriver(options);

        try {
            // 导航到首页
            driver.get("https://www.geeksforgeeks.org");

            // --- 步骤 A：创建 WebDriverWait 对象 ---
            // Duration.ofSeconds(10) 设置了超时阈值。如果 10 秒内元素没出现，就会报错。
            WebDriverWait wait = new WebDriverWait(driver, Duration.ofSeconds(10));

            // --- 步骤 B：定位并等待搜索框 ---
            // 很多网站的搜索框是通过 JS 动态加载的，直接 findElement 可能会失败
            // 我们使用 visibilityOf 条件，确保元素不仅存在，而且用户可见
            WebElement searchBox = wait.until(
                ExpectedConditions.visibilityOfElementLocated(By.id("gsc-i-id1"))
            );

            System.out.println("搜索框已加载，开始输入...");
            
            // --- 步骤 C：执行交互 ---
            searchBox.sendKeys("Selenium WebDriver");
            searchBox.sendKeys(Keys.RETURN);

            // --- 步骤 D：验证结果 ---
            // 我们不需要盲目等待，而是告诉程序：等到包含特定文本的元素出现
            // 如果出现，说明搜索成功
            boolean isResultLoaded = wait.until(
                ExpectedConditions.textToBePresentInElementLocated(
                    By.tagName("body"), 
                    "Selenium WebDriver"
                )
            );

            if (isResultLoaded) {
                System.out.println("测试通过：搜索结果已正确加载！");
            } else {
                System.out.println("测试失败：未找到搜索结果。");
            }

        } finally {
            driver.quit();
        }
    }
}

2026 技术趋势融合：AI 与云原生测试

作为经验丰富的技术专家，我们不能只停留在写脚本上。我们需要思考如何将 Selenium 集成到现代 DevSecOps 流程中。

1. Headless 模式与云端执行

如果你在本地开发，看着浏览器自动操作很有趣。但在 CI/CD 流水线（如 Jenkins, GitHub Actions）中，服务器通常没有图形界面。这时，Headless 模式（无头模式）是必须的。此外，现代云原生测试往往会将浏览器执行层容器化。

配置 Headless Chrome：

ChromeOptions options = new ChromeOptions();
// 启用无头模式，适合在 Linux 服务器或 Docker 容器中运行
options.addArguments("--headless=new"); // 新版 Chrome 推荐使用 --headless=new
options.addArguments("--disable-gpu"); // 某些系统下需要禁用 GPU 加速
options.addArguments("--no-sandbox"); // 在 Docker 容器中运行通常需要此参数

WebDriver driver = new ChromeDriver(options);

2. AI 辅助的调试与维护

在大型项目中，最大的挑战不是写新脚本，而是维护旧脚本。UI 一变，所有 findElement 就会失效。

我们如何利用 AI 应对？

在我们的最近的项目中，我们引入了 AI 辅助的 self-healing（自愈）机制概念。当 Selenium 找不到元素时，我们不再直接抛出异常让测试失败，而是结合视觉识别或 AI 分析页面结构，尝试用备用策略（比如换一个 CSS Selector 或 XPath）去寻找元素。

虽然完全的“自愈”还在探索阶段，但我们可以利用 AI 工具来快速定位问题。

场景：测试报告显示 NoSuchElementException。
传统做法：人工检查代码，打开开发者工具，重写定位器。
2026 做法：我们将错误截图和页面 DOM 结构抛给 AI 辅助工具（如 Katalon 或自定义的 GPT-4 脚本）。AI 会分析：“这个按钮的 ID 变了，但它的 Text 属性还是 ‘Submit‘，建议使用 By.linkText("Submit") 替代。”

3. 现代测试架构：Page Object Model (POM) 的演进

为了让代码更稳定、易维护，我们必须使用 Page Object Model (POM)。这不仅仅是设计模式，更是工程化的基础。我们将每个页面的定位器与测试逻辑分离。

简单的 POM 示例结构：

// LoginPage.java (页面对象类)
public class LoginPage {
    private WebDriver driver;
    
    // 定位器
    private By usernameInput = By.id("user-name");
    private By passwordInput = By.id("password");
    private By loginButton = By.id("login-btn");
    
    public LoginPage(WebDriver driver) {
        this.driver = driver;
    }
    
    // 封装行为，而不是暴露细节
    public void login(String user, String pwd) {
        driver.findElement(usernameInput).sendKeys(user);
        driver.findElement(passwordInput).sendKeys(pwd);
        driver.findElement(loginButton).click();
    }
}

// LoginTest.java (测试类)
// 测试类只关心业务流程，不关心输入框在哪里

这种分离使得当 UI 变化时，我们只需要修改 LoginPage.java，而无需修改成百上千个测试用例。

常见陷阱与故障排查指南

即使技术再进步，有些问题依然存在。让我们来看看 2026 年我们该如何处理这些顽疾。

1. 状态不一致

问题：同样的脚本，本地能跑，服务器上就跑不通。
解决方案：这通常是网络波动或环境差异导致的。我们建议引入 重试机制。TestNG 或 JUnit 5 都支持简单的失败重试注解。对于不稳定的第三方服务，我们可以在代码层面实现指数退避重试策略。

2. 弹窗与广告处理

问题：测试过程中突然弹出一个广告遮罩层，挡住了按钮，导致点击失败。
解决方案：不要试图硬编码等待广告关闭。更优雅的方式是，在执行关键操作前，先执行一段 JavaScript 代码来强制关闭所有已知的弹窗类。

// 在点击关键按钮前，注入 JS 清除干扰元素
JavascriptExecutor js = (JavascriptExecutor) driver;
js.executeScript(""
    const ads = document.querySelectorAll(‘.ad-overlay, .popup-class‘);
    ads.forEach(ad => ad.style.display = ‘none‘);
"");

总结与下一步

今天，我们完成了一次从 2026 年视角出发的技术探索。我们不仅学习了如何安装和使用 Selenium WebDriver，更重要的是，我们掌握了如何利用 Selenium Manager 简化配置，使用 显式等待 提高稳定性，并了解了 Headless 模式 和 POM 设计模式 在现代工程中的重要性。

自动化测试不仅是写脚本，更是为了构建一个快速反馈的质量闭环。随着 AI 技术的介入，未来的测试工程师将从繁琐的脚本维护中解放出来，更多地专注于测试策略和业务逻辑的覆盖。

我建议你下一步可以尝试：

尝试 Grid (Selenium Grid)：学习如何在多台机器和不同浏览器上并行运行测试。
结合 Docker：尝试将你的 Chrome 和测试脚本打包进 Docker 容器，体验真正的“一次构建，到处运行”。

希望这篇文章能帮助你顺利开启 Selenium 自动化测试之旅！祝你编码愉快！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客