利用PHP和Selenium自动化采集数据、实现爬虫抓取

作者：System 时间：2024年08月09日分类：所有,php 字数：670

这篇文章距离上次修改已过699天，其中的内容可能已经有所变动。




<?php
require 'vendor/autoload.php';
 
use Facebook\WebDriver\Remote\DesiredCapabilities;
use Facebook\WebDriver\Remote\RemoteWebDriver;
 
// 设置Selenium服务器的URL
$host = 'http://localhost:4444';
$capabilities = DesiredCapabilities::chrome();
 
// 初始化WebDriver对象
$driver = RemoteWebDriver::create($host, $capabilities);
 
// 打开目标网页
$driver->get('http://example.com');
 
// 执行自定义的Selenium命令来获取页面内容
$content = $driver->executeScript('return document.documentElement.innerText;');
 
// 输出页面内容
echo $content;
 
// 关闭浏览器
$driver->quit();
?>

这段代码展示了如何使用PHP和Selenium WebDriver来打开一个网页，并执行一个简单的JavaScript脚本来获取页面的纯文本内容。这是一个基本的爬虫采集数据的例子，可以根据实际需求进行功能扩展。

利用PHP和Selenium自动化采集数据、实现爬虫抓取

评论已关闭

推荐阅读