基于Python实现高德地图找房——爬虫设计部分
import requests
import pandas as pd
from bs4 import BeautifulSoup
# 高德地图房产查询URL
url = 'https://map.amap.com/place?query=房产&subquery=全国&city=010&geoobj=116.405285%7C39.904989%7C116.484811%7C40.003113&zoom=7'
# 发送请求,获取响应
response = requests.get(url)
# 解析HTML内容
soup = BeautifulSoup(response.text, 'html.parser')
# 提取房产信息
data = soup.find_all('div', class_='poi-title')
# 初始化列表存储房产信息
house_info = []
# 解析房产信息并存储
for info in data:
title = info.find('a').text.strip() # 获取房产名称
address = info.find('span', class_='address').text.strip() # 获取房产地址
house_info.append({'title': title, 'address': address})
# 将房产信息转换为DataFrame
df = pd.DataFrame(house_info)
# 打印前几行结果
print(df.head())
这段代码使用了requests库来发送HTTP请求,以及BeautifulSoup库来解析HTML内容。它提取了高德地图上的房产信息,并将其存储在一个DataFrame中,最后打印出前几行结果。这个过程展示了如何进行网页内容的抓取和数据的处理,是进行网络爬虫开发的一个基本示例。
评论已关闭