Pandas数据爬虫,爬取网页数据并存储至本地数据库
以下是一个使用Pandas进行数据爬取并存储到本地SQLite数据库的简单示例:
import pandas as pd
from sqlalchemy import create_engine
# 创建SQLite数据库引擎
engine = create_engine('sqlite:///example.db')
# 目标URL
url = 'http://example.com/data.csv'
# 读取网页上的CSV数据
df = pd.read_csv(url)
# 将数据存储到数据库中,假设表名为'data_table'
df.to_sql('data_table', con=engine, index=False, if_exists='replace')
确保你有适当的权限访问目标网页,并且网页上的数据可以用pd.read_csv()
方法解析。上述代码中的example.db
是SQLite数据库文件,data_table
是数据库中的表名。如果表已存在,它将被替换。
请根据实际情况调整URL、数据表名和数据库路径。如果目标数据不是CSV格式,可能需要使用不同的解析方法,如pd.read_html()
或pd.read_json()
等。
评论已关闭