5月28日 07:08

Puppeteer 和 Selenium 有什么区别？

核心结论

Puppeteer 和 Selenium 的根本区别在于通信协议：Puppeteer 基于 Chrome DevTools Protocol (CDP) 直接与浏览器内核通信，而 Selenium 基于 WebDriver 协议通过中间驱动层间接控制浏览器。这决定了两者在性能、能力和适用场景上的所有差异。

简单选择标准： 只需要操作 Chrome 且追求性能 → Puppeteer；需要跨浏览器或企业级测试 → Selenium。

通信协议的本质差异

这是理解两者所有区别的钥匙。

CDP（Puppeteer）： 通过 WebSocket 直接连接浏览器的调试端口，指令直达渲染进程。没有中间层翻译，所以快。代价是只能控制实现了 CDP 的浏览器，实际上就是 Chrome/Chromium。

WebDriver（Selenium）： 测试脚本 → WebDriver 客户端 → WebDriver 服务器（如 chromedriver）→ 浏览器。每一层都是一次进程间通信，不可避免地引入延迟。好处是 WebDriver 是 W3C 标准协议，任何浏览器只要实现 WebDriver 接口就能被 Selenium 控制。

javascript
// Puppeteer：直接通信，一步到位
const browser = await puppeteer.launch();
const page = await browser.newPage();
await page.goto('https://example.com');

// Selenium：经过驱动层中转
const driver = await new Builder().forBrowser('chrome').build();
await driver.get('https://example.com'); // 命令经 chromedriver 转发

什么时候选择 Puppeteer

场景一：网页爬虫和数据抓取

Puppeteer 的网络拦截能力是爬虫场景的核心武器。可以在请求层面直接屏蔽图片、字体等无关资源，大幅提升抓取速度。Selenium 没有原生的请求拦截能力，只能依赖第三方代理。

javascript
await page.setRequestInterception(true);
page.on('request', request => {
  const blocked = ['image', 'font', 'stylesheet'];
  blocked.includes(request.resourceType()) ? request.abort() : request.continue();
});

场景二：性能监控和页面指标采集

通过 CDP 可以直接读取浏览器内核的性能数据（LCP、FID、CLS 等），这是 Selenium 无法做到的。Chrome DevTools 的 Performance 面板能看到的指标，Puppeteer 都能程序化获取。

场景三：截图和 PDF 生成

Puppeteer 的截图 API 支持全页截图、指定元素截图、自定义视口。PDF 生成直接调用 Chrome 的打印引擎，排版效果与浏览器打印预览一致。Selenium 的截图功能相对基础，不支持 PDF 生成。

场景四：设备模拟和地理位置

javascript
// 一行代码模拟 iPhone 12
await page.emulate(puppeteer.devices['iPhone 12']);

// 设置地理位置
await page.setGeolocation({ latitude: 35.6895, longitude: 139.6917 });

什么时候选择 Selenium

场景一：跨浏览器兼容性测试

这是 Selenium 最不可替代的能力。如果你的产品需要保证在 Safari、Firefox、Edge 上都能正常运行，Selenium 是唯一成熟的选择。Puppeteer 对非 Chromium 浏览器的支持非常有限。

场景二：多语言技术栈

Selenium 支持 Java、Python、C#、Ruby、JavaScript 等主流语言。后端团队用 Java 写测试、数据团队用 Python 写测试、前端团队用 JavaScript 写测试，都能统一在 Selenium 体系下。Puppeteer 只支持 Node.js。

场景三：企业级分布式测试

Selenium Grid 支持在多台机器上并行运行测试，结合 Docker 可以快速搭建大规模测试集群。Puppeteer 本身没有分布式能力，需要借助第三方工具。

场景四：移动端测试

通过 Appium（基于 WebDriver 协议），Selenium 生态可以覆盖原生移动应用测试。Puppeteer 只能测试移动端网页，无法触及原生层。

性能对比的根因分析

不是"Puppeteer 更快"这么简单。快在哪里？

启动速度： Puppeteer 自带 Chromium，无需额外下载驱动；Selenium 需要匹配浏览器版本下载对应驱动，版本不匹配是常见报错来源
指令执行： CDP 单次指令延迟 <10ms，WebDriver 经驱动中转延迟 50-200ms
内存占用： Puppeteer 可通过 page.setRequestInterception 屏蔽无关资源，减少内存消耗；Selenium 无法在请求层做控制

但 Selenium 在 4.x 版本引入了 CDP 支持（SeV4CDP），部分缩小了性能差距。不过 CDP 功能在 Selenium 中属于实验性特性，稳定性和 API 完整度不如 Puppeteer。

2026 年的新变量：Playwright

讨论 Puppeteer vs Selenium 不能忽略 Playwright。微软推出的 Playwright 同时支持 Chromium、Firefox 和 WebKit，API 设计比 Puppeteer 更现代（自动等待、多页面上下文），性能接近 Puppeteer。

如果你正在做技术选型，决策逻辑应该是：

只需要 Chrome → Puppeteer
需要多浏览器 + 全新项目 → 优先考虑 Playwright
已有 Selenium 基础设施 / 需要 Java 等非 JS 语言 → Selenium

追问：Puppeteer 能用来做自动化测试吗？

可以，但要认清局限。Puppeteer 本质是浏览器控制库，不是测试框架。它没有内置的断言库、测试运行器、用例管理。实际项目中通常配合 Jest 或 Mocha 使用。

与 Selenium 作为测试框架的定位不同，Puppeteer 更适合作为工具链中的一环——爬虫用它抓数据，CI 用它做冒烟测试，监控系统用它采集性能指标。如果你需要的是一套完整的端到端测试方案，Selenium + 测试框架的组合更成熟；如果只需要轻量级的浏览器控制能力，Puppeteer 更灵活。

反过来，如果你的爬虫需要绕过反爬检测，Puppeteer 需要配合 stealth 插件隐藏自动化特征，而 Selenium 同样需要类似的反检测处理。两个工具在反爬场景下的表现差异不大，关键在于如何模拟真实用户行为。

标签：Puppeteer