在将亿级数据从MySQL迁移到MongoDB时,可以使用以下步骤:
- 数据库连接:使用适当的数据库驱动连接到MySQL和MongoDB。
- 查询数据:在MySQL中使用分页查询来逐批获取数据。
- 数据迁移:逐批将数据插入到MongoDB中。
- 错误处理:实现异常处理,如重试机制和错误日志记录。
以下是一个简化的Python示例代码,演示如何使用pymysql
连接MySQL和pymongo
连接MongoDB,并使用分页查询和批量插入来迁移数据:
import pymysql
import pymongo
# 连接MySQL
mysql_conn = pymysql.connect(host='your_mysql_host', user='your_user', password='your_password', db='your_db')
mysql_cursor = mysql_conn.cursor(pymysql.cursors.DictCursor)
# 连接MongoDB
mongo_client = pymongo.MongoClient('mongodb://your_mongodb_host:27017/')
db = mongo_client['your_db']
collection = db['your_collection']
# 分页参数
page_size = 10000
offset = 0
while True:
# MySQL分页查询
mysql_cursor.execute("SELECT * FROM your_table LIMIT %s, %s", (offset, page_size))
rows = mysql_cursor.fetchall()
if not rows:
break # 没有更多数据时退出循环
# 插入到MongoDB
collection.insert_many(rows)
# 更新偏移量
offset += page_size
# 关闭连接
mysql_cursor.close()
mysql_conn.close()
请根据实际情况替换your_mysql_host
, your_user
, your_password
, your_db
, your_table
, your_mongodb_host
, your_db
, 和your_collection
为你的实际数据库信息。
注意:在生产环境中,你可能需要考虑更多的因素,如:索引优化、批量大小、网络问题处理、资源管理(内存、连接池)、性能监控和调优、故障恢复策略等。