【Python 网络爬虫】使用 urllib 爬取网页源码、图片和视频
import urllib.request
import os
# 下载网页内容
def download_page(url):
with urllib.request.urlopen(url) as response, open('page.html', 'wb') as file:
file.write(response.read())
# 下载图片
def download_image(url, filename):
with urllib.request.urlopen(url) as response, open(filename, 'wb') as file:
file.write(response.read())
# 下载视频
def download_video(url, filename):
with urllib.request.urlopen(url) as response, open(filename, 'wb') as file:
file.write(response.read())
# 示例使用
url = 'http://example.com'
download_page(url) # 下载网页
image_url = 'http://example.com/image.jpg'
download_image(image_url, 'image.jpg') # 下载图片
video_url = 'http://example.com/video.mp4'
download_video(video_url, 'video.mp4') # 下载视频
这段代码提供了三个函数,分别用于下载网页、图片和视频。每个函数都使用了urllib.request
来打开网络资源,并将内容写入本地文件。使用时,只需要提供相应的URL和文件名即可。这是一个简单的网络爬虫示例,适合作为初学者理解和实践的基础。
评论已关闭