Python自带爬虫库urllib

这篇文章距离上次修改已过693天，其中的内容可能已经有所变动。

Python自带的爬虫库urllib提供了一系列用于网络请求的功能。以下是一个使用urllib进行简单网页爬取的示例代码：




import urllib.request
 
# 目标网页URL
url = 'http://www.example.com/'
 
# 发送请求
response = urllib.request.urlopen(url)
 
# 读取网页内容
html = response.read()
 
# 将网页内容转换为字符串
html_str = html.decode('utf-8')
 
# 打印网页内容
print(html_str)

这段代码使用urllib.request.urlopen()函数向指定的URL发送请求，并读取返回的响应内容。然后，使用decode()方法将字节流转换为字符串，以便我们可以阅读网页内容。最后，打印出网页内容。

Python自带爬虫库urllib

评论已关闭

推荐阅读