Python爬虫——1爬虫基础(一步一步慢慢来)
import requests
from bs4 import BeautifulSoup
# 第一步:发送请求,获取网页内容
url = 'https://www.example.com'
response = requests.get(url)
# 第二步:解析网页内容,提取有效信息
soup = BeautifulSoup(response.text, 'html.parser')
title = soup.find('title').text
# 第三步:打印结果
print(title)
这段代码使用了requests
库来发送HTTP GET请求,获取网页内容,然后使用BeautifulSoup
来解析HTML并提取其中的标题。最后,打印出获取到的标题。这是爬虫开发中最基础的步骤,为学习爬虫技术提供了一个简单的示例。
评论已关闭