AI 数据观 | TapData Cloud + MongoDB Atlas:大模型与 RAG 技术有机结合,落地实时工单处理智能化解决方案
from pymongo import MongoClient
from tapdata_cloud.client import Client
from tapdata_cloud.stream import Stream
# 配置 MongoDB Atlas 连接信息
mongodb_uri = "mongodb+srv://<username>:<password>@<cluster-name>.mongodb.net/test?retryWrites=true&w=majority"
client = MongoClient(mongodb_uri)
db = client["test"] # 使用 'test' 数据库
collection = db["tapdata_cloud_data"] # 使用 'tapdata_cloud_data' 集合
# 配置 Tapdata Cloud 连接信息
tapdata_cloud_client = Client(
"<Tapdata Cloud 用户名>",
"<Tapdata Cloud 密码>",
"<Tapdata Cloud 服务器地址>"
)
# 创建数据流,从 Tapdata Cloud 接收数据
stream = Stream(tapdata_cloud_client, "<Tapdata Cloud 任务ID>")
# 循环接收数据并写入 MongoDB Atlas
for data in stream:
collection.insert_one(data)
这段代码展示了如何使用 Python 的 pymongo
库连接 MongoDB Atlas,并使用 Tapdata Cloud Python SDK 从指定的 Tapdata Cloud 任务中接收数据,然后将数据实时写入 MongoDB Atlas 数据库中。这是一个实时数据集成的典型应用场景,适用于需要将大规模数据实时同步至 MongoDB 进行进一步处理的场景。
评论已关闭