揭秘火车头:轻松搞定Ajax实时数据抓取
import requests
from bs4 import BeautifulSoup
# 定义一个函数来抓取Ajax内容
def fetch_ajax_content(url, session):
# 使用requests发送请求,并获取响应
response = session.get(url)
# 如果请求成功,解析JSON数据
if response.status_code == 200:
return response.json()
return None
# 定义主程序
def main():
# 初始化一个requests会话
with requests.Session() as session:
# 设置请求头,模拟浏览器访问
session.headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3"}
# 输入要抓取的URL
url = "http://example.com/api/data"
# 调用函数获取Ajax内容
ajax_content = fetch_ajax_content(url, session)
# 如果获取到了内容,进行处理(例如打印)
if ajax_content:
print(ajax_content)
else:
print("无法获取Ajax内容")
# 如果这个脚本被直接运行,则执行主程序
if __name__ == "__main__":
main()
这个代码示例展示了如何使用Python的requests库和JSON解析功能来抓取和处理Ajax内容。首先定义了一个函数fetch_ajax_content
来处理请求和JSON解析,然后在main
函数中初始化一个requests会话,设置请求头,并调用fetch_ajax_content
函数来获取和打印Ajax内容。最后,如果这个脚本被直接执行,则执行主程序。
评论已关闭