from langchain.llms import LlamaIndex
from langchain.chains import RetrievalQA
from langchain.document_loaders import MarkdownLoader
from langchain.vectorstores import VectorStore
# 创建LlamaIndex
llama_index = LlamaIndex(model_name="tiktoker/rag-llama-7b-int4")
# 创建MarkdownLoader来加载文档
loader = MarkdownLoader()
# 加载文档
documents = loader.load_from_file("documents.md")
# 将文档添加到LlamaIndex中
llama_index.add_documents(documents)
# 创建一个基于LlamaIndex的VectorStore
vectorstore = VectorStore.from_llm(llama_index)
# 创建多重检索问答链
qa_chain = RetrievalQA(
vectorstore=vectorstore,
retriever_options={"k": 10},
reader_options={"top_p": 0.95, "max_length": 500},
)
# 设置用户查询
query = "请解释RAG模型的工作原理。"
# 执行查询并获取结果
result = qa_chain.run(query)
print(result)
这段代码展示了如何使用LangChain和LlamaIndex创建一个简单的多重检索RAG模型问答系统。首先,我们创建了一个LlamaIndex,并加载了一些Markdown格式的文档。然后,我们将这些文档添加到LlamaIndex中,并使用它来初始化一个VectorStore。最后,我们创建了一个RetrievalQA对象,并设置了一些参数,如k-nearest neighbors的数量、生成文本的顶部概率和最大长度。用户提交一个查询,系统会根据RAG模型的知识来回答问题。