【爬虫基础】第2讲 使用Urllib库创建第一个爬虫程序
import urllib.request
# 目标URL
url = 'http://example.com/'
# 使用urllib.request.urlopen打开URL
response = urllib.request.urlopen(url)
# 读取响应内容
html = response.read()
# 将读取的内容转换为字符串
html_string = html.decode("utf-8")
# 打印网页内容
print(html_string)
这段代码使用了urllib.request
库来打开一个网页,并读取了其内容。然后将读取的内容转换为字符串并打印出来。这是编写爬虫程序的基础,可以教会你如何使用Python进行基本的网络请求。
评论已关闭