【Python 网络爬虫】使用 urllib 爬取网页源码、图片和视频

作者：System 时间：2024年08月16日分类：所有,爬虫字数：910

这篇文章距离上次修改已过716天，其中的内容可能已经有所变动。




import urllib.request
import os
 
# 下载网页内容
def download_page(url):
    with urllib.request.urlopen(url) as response, open('page.html', 'wb') as file:
        file.write(response.read())
 
# 下载图片
def download_image(url, filename):
    with urllib.request.urlopen(url) as response, open(filename, 'wb') as file:
        file.write(response.read())
 
# 下载视频
def download_video(url, filename):
    with urllib.request.urlopen(url) as response, open(filename, 'wb') as file:
        file.write(response.read())
 
# 示例使用
url = 'http://example.com'
download_page(url)  # 下载网页
 
image_url = 'http://example.com/image.jpg'
download_image(image_url, 'image.jpg')  # 下载图片
 
video_url = 'http://example.com/video.mp4'
download_video(video_url, 'video.mp4')  # 下载视频

这段代码提供了三个函数，分别用于下载网页、图片和视频。每个函数都使用了urllib.request来打开网络资源，并将内容写入本地文件。使用时，只需要提供相应的URL和文件名即可。这是一个简单的网络爬虫示例，适合作为初学者理解和实践的基础。

【Python 网络爬虫】使用 urllib 爬取网页源码、图片和视频

评论已关闭

推荐阅读