LLM之RAG实战| 利用MongoDB矢量搜索实现RAG高级检索




from pymongo import MongoClient
from bson import ObjectId
from langchain.vectorstores import MongoDBVectorStore
from langchain.llms import LLM
from langchain.prompts import LLMPrompt
from langchain.vectorstores import VectorStore
from langchain.chains import RetrievalQA
from langchain.text_splitter import CharacterTextSplitter
from langchain.vectorstores import DPRVectorStore
 
# 连接到MongoDB
client = MongoClient("mongodb://localhost:27017/")
db = client["rag"]
 
# 初始化MongoDBVectorStore
vector_store = MongoDBVectorStore(db=db, collection_name="vectors")
 
# 初始化LLM
llm = LLM()
 
# 创建LLMPrompt实例
prompt = LLMPrompt(
    input_variables=["query"],
    template="The answer to the query is: {}",
)
 
# 创建DPRVectorStore实例
dpr_vector_store = DPRVectorStore.from_prebuilt("text-encoder-distilbert-base-nli-stsb-mean-tokens")
 
# 创建RetrievalQA实例
qa_chain = RetrievalQA(
    llm=llm,
    vector_store=vector_store,
    dpr_vector_store=dpr_vector_store,
    prompt=prompt,
    retriever_type="vector",
    search_kwargs={"size": 5},
    input_text_splitter=CharacterTextSplitter(),
)
 
# 查询函数
def query(query: str):
    result = qa_chain.run(query=query)
    return result
 
# 示例查询
query_result = query("What is the capital of France?")
print(query_result)

这段代码展示了如何使用MongoDB作为矢量数据库,并结合LLM、DPR向量存储和RetrievalQA链来实现一个简单的RAG系统的查询功能。代码中创建了连接到MongoDB的客户端、初始化了MongoDBVectorStore和LLM,并定义了一个查询函数,该函数使用RetrievalQA链来处理用户查询并返回结果。

最后修改于:2024年08月29日 17:51

评论已关闭

推荐阅读

DDPG 模型解析,附Pytorch完整代码
2024年11月24日
DQN 模型解析,附Pytorch完整代码
2024年11月24日
AIGC实战——Transformer模型
2024年12月01日
Socket TCP 和 UDP 编程基础(Python)
2024年11月30日
python , tcp , udp
如何使用 ChatGPT 进行学术润色?你需要这些指令
2024年12月01日
AI
最新 Python 调用 OpenAi 详细教程实现问答、图像合成、图像理解、语音合成、语音识别(详细教程)
2024年11月24日
ChatGPT 和 DALL·E 2 配合生成故事绘本
2024年12月01日
omegaconf,一个超强的 Python 库!
2024年11月24日
【视觉AIGC识别】误差特征、人脸伪造检测、其他类型假图检测
2024年12月01日
[超级详细]如何在深度学习训练模型过程中使用 GPU 加速
2024年11月29日
Python 物理引擎pymunk最完整教程
2024年11月27日
MediaPipe 人体姿态与手指关键点检测教程
2024年11月27日
深入了解 Taipy:Python 打造 Web 应用的全面教程
2024年11月26日
基于Transformer的时间序列预测模型
2024年11月25日
Python在金融大数据分析中的AI应用(股价分析、量化交易)实战
2024年11月25日
AIGC Gradio系列学习教程之Components
2024年12月01日
Python3 `asyncio` — 异步 I/O,事件循环和并发工具
2024年11月30日
llama-factory SFT系列教程:大模型在自定义数据集 LoRA 训练与部署
2024年12月01日
Python 多线程和多进程用法
2024年11月24日
Python socket详解,全网最全教程
2024年11月27日