如何利用 Selenium 对已打开的浏览器进行爬虫

作者：System 时间：2024年08月23日分类：所有,爬虫字数：898

这篇文章距离上次修改已过530天，其中的内容可能已经有所变动。

要使用Selenium对已经打开的浏览器进行自动化操作，你需要通过Selenium的RemoteWebDriver来连接到浏览器。这通常涉及到Selenium Server或者是使用现代的浏览器驱动程序（如ChromeDriver或GeckoDriver）直接连接到浏览器的驱动端。

以下是一个使用Python和Selenium连接到已打开浏览器的基本示例：




from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.remote_connection import RemoteWebDriver
 
# 假设你已经知道浏览器的remote_debugging_port
# 例如，对于Chrome浏览器，你可以在启动时添加 --remote-debugging-port=9222
 
# 创建一个RemoteWebDriver对象，指向已打开浏览器的端口
# 注意：这里的9222是示例端口，你需要替换为实际使用的端口
service = Service('path/to/your/chromedriver')
driver = RemoteWebDriver(service.service_url, desired_capabilities={})
 
# 现在你可以使用driver对象来控制浏览器了
# 例如，获取当前页面的标题
print(driver.title)
 
# 在结束时关闭浏览器
driver.quit()

请注意，这个方法要求你知道浏览器的remote\_debugging\_port，并且浏览器允许远程调试。不是所有的浏览器都允许被远程控制，这通常只在开发或测试环境中使用。

如果你没有控制权限启动浏览器，这种方法就不适用了。在这种情况下，你需要启动一个新的浏览器实例并传递Selenium所需的启动参数。

如何利用 Selenium 对已打开的浏览器进行爬虫

评论已关闭

推荐阅读