python-爬虫实例:获取b站的章若楠的视频




import requests
from bs4 import BeautifulSoup
import re
 
# 获取B站用户上传视频的网页
def get_video_page(user_id):
    url = f'https://space.bilibili.com/ajax/member/getSubmitVideos?mid={user_id}&pagesize=30&tid=0&page=1&keyword=&order=pubdate'
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
    response = requests.get(url, headers=headers)
    return response.text
 
# 解析视频信息
def parse_video_info(html):
    soup = BeautifulSoup(html, 'html.parser')
    video_list = soup.find_all('a', class_='title')
    for video in video_list:
        yield {
            'title': video.text.strip(),
            'url': 'https://www.bilibili.com' + video['href']
        }
 
# 下载视频
def download_video(video_url, video_title):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3',
        'Referer': video_url
    }
    response = requests.get(video_url, headers=headers)
    html = response.text
    video_url = re.findall(r'\"video_url\":\"(https:\/\/.*?)\"', html)[0]
    video_data = requests.get(video_url, headers=headers).content
    with open(f'{video_title}.mp4', 'wb') as file:
        file.write(video_data)
 
# 主函数
def main(user_id):
    html = get_video_page(user_id)
    for video in parse_video_info(html):
        print(video)
        download_video(video['url'], video['title'])
 
if __name__ == '__main__':
    user_id = 28376665  # 章若楠的B站ID
    main(user_id)

这段代码首先定义了获取B站用户上传视频的网页的函数get_video_page,然后定义了解析视频信息的函数parse_video_info,接着定义了下载视频的函数download_video,最后在main函数中调用这些函数来获取并下载章若楠的视频。这个例子展示了如何结合requests、BeautifulSoup和正则表达式来进行网页数据的抓取和处理。

最后修改于:2024年08月11日 18:07

评论已关闭

推荐阅读

Vue中使用mind-map实现在线思维导图
2024年08月04日
VUE
Web前端最全Vue实现免密登录跳转的方式_vue怎么样不登录返回首页,最强技术实现
2024年08月04日
VUE
vue3 项目搭建教程(基于create-vue,vite,Vite + Vue)
2024年08月04日
VUE
Vue-颜色选择器实现方案——>Vue-Color( 实战*1+ Demo*7)
2024年08月04日
VUE
Vue项目卡顿慢加载?这些优化技巧告诉你!_vue数据多渲染卡顿
2024年08月04日
VUE
vue中的keep-alive详解与应用场景
2024年08月04日
VUE
Vue、React实现excel导出功能(三种实现方式保姆级讲解)
2024年08月04日
vue-office/docx插件实现docx文件预览
2024年08月04日
VUE
java调用js文件的两种方法(支持V8引擎)
2024年08月04日
JavaScript:解决计算精度问题/mathjs/bignumber.js/big.js/decimal.js
2024年08月04日
两周从爬虫小白变大神 _yjs_js_security_passport
2024年08月04日
JS笔记(对象、函数、数组)
2024年08月04日
Markdown.js:强大的纯JavaScript Markdown解析器
2024年08月04日
Vue项目:js模拟点击a标签下载文件并重命名,URL文件地址下载方法、请求接口下载文件方法总结。
2024年08月04日
vue 父组件怎么获取子组件里面的data数据
2024年08月04日
VUE
个人开发实现AI套壳网站快速搭建(Vue+elementUI+SpringBoot)
2024年08月04日
el-table 表格封装并改造实现单元格可编辑
2024年08月04日
none
nodejs环境下创建vue项目、SSH密钥登陆!!!
2024年08月04日
vue+quill+element-ui实现视频、图片上传及缩放保姆级教程,轻松使用富文本
2024年08月04日
【three.js】22. Imported Models导入模型
2024年08月04日