网易云爬虫评论(Selenium 方式)——part 1 前端内容获取
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import time
# 初始化webdriver
driver_path = 'chromedriver的路径'
driver = webdriver.Chrome(executable_path=driver_path)
# 打开网易云音乐评论页面
driver.get('网易云音乐歌曲评论页面的URL')
# 滚动到页面底部
js = "window.scrollTo(0, document.body.scrollHeight)"
driver.execute_script(js)
# 等待动态加载的评论出现
comments_locator = (By.XPATH, '//div[@class="cmmts j-flag"]')
comments_element = WebDriverWait(driver, 10).until(EC.presence_of_element_located(comments_locator))
# 获取评论内容
comments = comments_element.find_elements_by.xpath('.//div[@class="cnt f-brk"]')
for comment in comments:
print(comment.text)
# 关闭浏览器
driver.quit()
这段代码使用了Selenium WebDriver来打开网易云音乐的评论页面,并滚动到页面底部以确保所有评论都被加载出来。然后它使用XPath定位到包含所有评论的元素,并遍历这些元素来打印出评论内容。最后,代码会关闭浏览器窗口,释放资源。
评论已关闭