python批量地址爬取(高德地图)
import requests
import pandas as pd
import time
def get_lng_lat(address, key):
"""
根据地址获取经纬度
:param address: 地址
:param key: 高德开放平台的API Key
:return: 经纬度列表
"""
base = 'https://restapi.amap.com/v3/geocode/geo?'
parameters = {
'key': key,
'address': address
}
response = requests.get(base, params=parameters)
data = response.json()
if data.get('status') == '1':
geo = data.get('geocodes')[0].get('location')
return geo.split(',')
else:
return ['NA', 'NA']
def batch_get_coordinates(df, column, key):
"""
批量获取经纬度
:param df: DataFrame对象
:param column: 地址列名
:param key: 高德开放平台的API Key
:return: 包含经纬度的DataFrame
"""
df['lng'] = df[column].apply(lambda x: get_lng_lat(x, key)[0])
df['lat'] = df[column].apply(lambda x: get_lng_lat(x, key)[1])
return df
# 示例使用
df = pd.DataFrame({'address': ['北京市朝阳区', '上海市浦东新区', '广州市天河区']})
key = '您的高德开放平台API Key'
df_result = batch_get_coordinates(df, 'address', key)
print(df_result)
这段代码首先定义了一个函数get_lng_lat
,它接受一个地址和高德开放平台的API Key,然后向高德地图API发送请求,并返回对应的经纬度列表。接着定义了一个函数batch_get_coordinates
,它接受一个DataFrame和地址所在的列名,以及API Key,然后对于DataFrame中的每一行地址,它都会调用get_lng_lat
函数来获取对应的经纬度,并将结果添加到DataFrame中。最后,提供了一个使用示例,展示了如何使用这两个函数来批量获取一系列地址的经纬度信息。
评论已关闭