import requests
from bs4 import BeautifulSoup
import os
# 图片下载函数
def download_image(image_url, image_name):
response = requests.get(image_url)
with open(image_name, 'wb') as file:
file.write(response.content)
print(f"图片 {image_name} 下载成功!")
# 主函数
def main(url):
# 请求网页
response = requests.get(url)
# 解析网页
soup = BeautifulSoup(response.text, 'html.parser')
# 找到图片链接
image_urls = [img['src'] for img in soup.find_all('img', class_='lazy image_detail')]
# 创建图片保存目录
if not os.path.exists('images'):
os.makedirs('images')
# 下载图片
for i, image_url in enumerate(image_urls):
image_name = f"image_{i+1}.jpg"
download_image(image_url, os.path.join('images', image_name))
# 运行主函数,替换URL为你要爬取的网页地址
if __name__ == "__main__":
main('https://www.example.com')
这个简化的代码实例展示了如何使用Python的requests和BeautifulSoup库来爬取网页上的图片。代码首先定义了一个下载图片的函数,然后在主函数中实现了网页内容的请求、解析和图片下载的流程。在实际应用中,你需要根据目标网页的结构来调整find_all
方法中的参数,以及相应的图片链接提取方式。