Python爬虫之理解基础爬虫(含爬取文本小项目)
import requests
# 目标网页URL
url = 'https://example.com/some_text'
# 发送HTTP GET请求
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 解析响应内容,这里假设网页内容是纯文本
text = response.text
# 打印或处理文本内容
print(text)
# 保存到文件(如果需要)
with open('downloaded_text.txt', 'w', encoding='utf-8') as file:
file.write(text)
else:
print(f"请求失败,状态码: {response.status_code}")
这段代码使用了requests
库来发送一个HTTP GET请求到指定的URL,获取网页内容,并打印出来。如果你需要将内容保存到文件,可以取消注释保存到文件的部分代码。这是一个简单的Python爬虫示例,适合作为学习如何开始编写爬虫的起点。
评论已关闭