Python中关于urllib库和request库详细教程
urllib
和urllib2
是Python 2中的两个库,用于处理URLs,但它们在Python 3中被合并为urllib
。urllib3
是一个独立的库,提供了更多的功能,比如高级的连接池管理和会话处理。
在Python 3中,urllib
被改变了,主要包含以下四个模块:
urllib.request
:用于打开和读取URLs,相当于Python 2中的urllib2
和urllib
的组合。urllib.parse
:用于解析URLs的工具。urllib.robotparse
:用于解析robots.txt
文件。urllib.error
:包含了urllib.request
抛出的异常。
以下是使用urllib.request
的一个简单示例:
import urllib.request
# 打开一个URL
response = urllib.request.urlopen('http://www.example.com/')
# 读取网页内容
html = response.read()
# 打印内容
print(html)
如果你需要使用urllib3
,可以这样安装它:
pip install urllib3
然后在代码中使用:
import urllib3
http = urllib3.PoolManager()
# 发送GET请求
response = http.request('GET', 'http://www.example.com/')
# 读取响应内容
html = response.data
# 打印内容
print(html)
urllib3
提供了更高级的功能,比如自动处理重定向和Compression。
总结:urllib.request
适用于基本的HTTP请求,而urllib3
提供了更高级的功能,如HTTPS支持、文件上传、cookie处理等。根据你的需求选择合适的库。
评论已关闭