AI创想

标题: LangChain入门2 RAG详解 [打印本页]

作者: PillsSkiny    时间: 8 小时前
标题: LangChain入门2 RAG详解
作者:CSDN博客
RAG概述

一个典型的RAG应用程序,它有两个主要组件:
从原始数据到答案的完整序列如下所示:
索引

检索和生成

代码实例

依赖加载
  1. from langchain_community.llms import Ollama
  2. import bs4
  3. from langchain import hub
  4. from langchain_community.document_loaders import WebBaseLoader
  5. from langchain_chroma import Chroma
  6. from langchain_core.output_parsers import StrOutputParser
  7. from langchain_core.runnables import RunnablePassthrough
  8. from langchain_community.embeddings import OllamaEmbeddings
  9. from langchain_text_splitters import RecursiveCharacterTextSplitter
复制代码
  1. #实例化大模型
  2. llm = Ollama(model="llama2")#添加向量化
  3. embeddings = OllamaEmbeddings()
复制代码
  1. # 加载数据
  2. loader = WebBaseLoader(
  3.     web_paths=("https://lilianweng.github.io/posts/2023-06-23-agent/",),
  4.     bs_kwargs=dict(
  5.         parse_only=bs4.SoupStrainer(
  6.             class_=("post-content","post-title","post-header"))),)
  7. docs = loader.load()
复制代码
  1. #我们这里查看具体的下载内容print(docs)
复制代码
查看具体的下载内容

(, 下载次数: 0)

加载数据的拆分和灌库
  1. #添加数据的拆分 每1000个为一组并重叠200个字符
  2. text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)#拆分下载的数据
  3. splits = text_splitter.split_documents(docs)#灌入向量数据库
  4. vectorstore
复制代码
原文地址:https://blog.csdn.net/weixin_41870426/article/details/138248409




欢迎光临 AI创想 (https://www.llms-ai.com/) Powered by Discuz! X3.4