python selenium 爬虫教程_python selenium爬虫,Python面试项目全代码
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import time
# 初始化webdriver
driver = webdriver.Chrome()
# 打开网页
driver.get("http://example.com")
# 等待网页加载完成
wait = WebDriverWait(driver, 10)
wait.until(EC.presence_of_element_located((By.ID, "myElementId")))
# 执行动作链,模拟鼠标点击操作
actions = webdriver.ActionChains(driver)
actions.move_to_element(driver.find_element(By.ID, "myMenu")).click(driver.find_element(By.ID, "subMenu")).perform()
# 输入搜索内容
input_element = driver.find_element(By.ID, "mySearchBar")
input_element.send_keys("search keyword")
# 提交搜索
input_element.send_keys(Keys.RETURN)
# 滚动页面
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
# 等待动态内容加载
time.sleep(5)
# 获取页面源代码
page_source = driver.page_source
# 清理:关闭浏览器
driver.quit()
这段代码展示了如何使用Selenium WebDriver在Python中打开一个网页,执行鼠标点击、输入搜索关键字、提交搜索和滚动页面的基本操作。同时,它还展示了如何使用ActionChains来模拟复杂的用户动作。最后,代码中使用了time.sleep()
来等待动态内容加载,这通常不是推荐的做法,可以使用WebDriverWait来代替,但出于教学目的,这里简化了处理方式。
评论已关闭