以下是一个简单的Python爬虫示例,用于爬取每天凌晨1点到达的美丽妞妞图片,并保存到本地。
import requests
from bs4 import BeautifulSoup
import os
import time
def save_image(image_url, file_path):
response = requests.get(image_url)
with open(file_path, 'wb') as file:
file.write(response.content)
print(f"图片保存成功: {file_path}")
def get_images_from_web(url):
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
image_urls = [image['src'] for image in soup.find_all('img', class_='lazy image_dfn')]
return image_urls
def main():
base_url = 'https://desk.zol.com.cn/bizhi/' # 美丽图片网站的基础URL
web_images = get_images_from_web(base_url) # 获取网站上的所有图片链接
# 设置图片保存的本地目录
save_dir = 'beautiful_girls'
if not os.path.exists(save_dir):
os.makedirs(save_dir)
# 遍历图片链接并保存图片
for index, image_url in enumerate(web_images):
file_path = os.path.join(save_dir, f"{index}.jpg")
save_image(image_url, file_path)
time.sleep(1) # 暂停一段时间防止被网站封禁
if __name__ == '__main__':
main()
这段代码会定时在凌晨1点执行,抓取指定网站上的图片,并保存到本地指定的文件夹。注意,爬取过程中需要遵守网站的robots.txt规则,并尊重网站版权,合理使用爬虫技术。