大模型实战营第三次课笔记

发表于 2024-01-08 更新于 2024-03-19

基于InternLM和LangChain搭建知识库

RAG(Retrieval Augmented Generation, 检索增强生成) v.s. Finetune

RAG 原理

RAG之前没有做过，不过通过这次作业的基础部分来看，RAG在数据量很小（demo未经改动仅处理了文档的前10个）的情况下似乎并不完全可信。

demo里给了一个使用UnstructuredMarkdownLoader和UnstructuredTextLoader加载markdown和txt文件，以及使用RecursiveCharacterTextSplitter进行文本分割的例子。

这是通过继承LLM类并重写其中的调用方法_call()实现的

本质上是以第3步建立的向量数据库作为外接查询，使这一步接入的LLM具有查询能力。具体探索见作业