利用PHP和Selenium自动化采集数据、实现爬虫抓取
<?php
require 'vendor/autoload.php';
use Facebook\WebDriver\Remote\DesiredCapabilities;
use Facebook\WebDriver\Remote\RemoteWebDriver;
// 设置Selenium服务器的URL
$host = 'http://localhost:4444';
$capabilities = DesiredCapabilities::chrome();
// 初始化WebDriver对象
$driver = RemoteWebDriver::create($host, $capabilities);
// 打开目标网页
$driver->get('http://example.com');
// 执行自定义的Selenium命令来获取页面内容
$content = $driver->executeScript('return document.documentElement.innerText;');
// 输出页面内容
echo $content;
// 关闭浏览器
$driver->quit();
?>
这段代码展示了如何使用PHP和Selenium WebDriver来打开一个网页,并执行一个简单的JavaScript脚本来获取页面的纯文本内容。这是一个基本的爬虫采集数据的例子,可以根据实际需求进行功能扩展。
评论已关闭