Python-天天基金网爬虫分析
import requests
from bs4 import BeautifulSoup
def get_fund_data(fund_code):
url = f"http://fund.eastmoney.com/{fund_code}.html"
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
res = requests.get(url, headers=headers)
res.raise_for_status()
res.encoding = 'utf-8'
soup = BeautifulSoup(res.text, 'html.parser')
# 基金名称
fund_name = soup.select('#fundName')[0].text
# 最新Net值
net_value = soup.select('.Data_netWorth')[0].text.strip()
# 单位Net值
unit_net_value = soup.select('.Data_nav')[0].text.strip()
# 成立时间
established_time = soup.select('.Wraper_fundInfo .Info_time')[0].text.strip()
# 基金经理
manager = soup.select('.Wraper_fundInfo .Info_fundManager')[0].text.strip()
print(f"基金名称: {fund_name}")
print(f"最新Net值: {net_value}")
print(f"单位Net值: {unit_net_value}")
print(f"成立时间: {established_time}")
print(f"基金经理: {manager}")
# 使用示例
get_fund_data('003526')
这段代码定义了一个get_fund_data
函数,它接受一个基金代码作为参数,通过请求天天基金网站的相应页面,使用BeautifulSoup解析网页,提取基金的名称、最新Net值、单位Net值、成立时间和基金经理信息,并打印输出。使用时只需调用get_fund_data
函数并传入相应的基金代码即可获取相应的基金信息。
评论已关闭