如何使用PHP和Selenium快速构建自己的网络爬虫系统
<?php
require 'vendor/autoload.php';
use Facebook\WebDriver\Remote\DesiredCapabilities;
use Facebook\WebDriver\Remote\RemoteWebDriver;
// 设置Selenium服务器的URL
$host = 'http://localhost:4444';
$capabilities = DesiredCapabilities::chrome();
// 初始化WebDriver对象
$driver = RemoteWebDriver::create($host, $capabilities);
// 打开网页
$driver->get('http://your-target-website.com');
// 获取页面标题
$title = $driver->getTitle();
echo "Page title is: " . $title;
// 关闭浏览器
$driver->quit();
?>
这段代码展示了如何使用Composer加载selenium webdriver的PHP客户端,并初始化一个WebDriver实例来打开一个网页并获取其标题。这是一个简单的示例,实际的爬虫系统可能需要更复杂的逻辑来导航页面、查询元素、提取数据等。
评论已关闭