Python爬虫之理解基础爬虫（含爬取文本小项目）

作者：System 时间：2024年08月10日分类：所有,爬虫字数：571

这篇文章距离上次修改已过714天，其中的内容可能已经有所变动。




import requests
 
# 目标网页URL
url = 'https://example.com/some_text'
 
# 发送HTTP GET请求
response = requests.get(url)
 
# 检查请求是否成功
if response.status_code == 200:
    # 解析响应内容，这里假设网页内容是纯文本
    text = response.text
    
    # 打印或处理文本内容
    print(text)
    
    # 保存到文件（如果需要）
    with open('downloaded_text.txt', 'w', encoding='utf-8') as file:
        file.write(text)
else:
    print(f"请求失败，状态码: {response.status_code}")

这段代码使用了requests库来发送一个HTTP GET请求到指定的URL，获取网页内容，并打印出来。如果你需要将内容保存到文件，可以取消注释保存到文件的部分代码。这是一个简单的Python爬虫示例，适合作为学习如何开始编写爬虫的起点。

Python爬虫之理解基础爬虫（含爬取文本小项目）

评论已关闭

推荐阅读