一个适合学习、使用、自主扩展的RAG【检索增强生成】系统!
1、目前已有的功能
知识库(目前仅支持txt\csv\pdf\md\doc\docx\mp3\mp4\wav\excel\格式数据):
1、知识库的创建
2、知识库的更新
3、删除知识库中某个文件
4、删除知识库
5、向量化知识库
6、支持音频视频的语音转文本然后向量化
语音转文本 使用的 funasr ,第一次启动时,会从魔塔下载模型,可能会慢一些,之后会自动加载模型
chat
1、支持纯大模型聊天多伦
2、支持知识库问答 ["复杂召回方式", "简单召回方式","rerank"]
3、通过使用rerank重新排序来提高检索效率
本次rerank 使用了bge-reranker-large 模型,需要下载到本地,然后再 rag/rerank.py中配置路径
模型地址:https://hf-mirror.com/BAAI/bge-reranker-large
2、后续更新计划
知识库:
0、支持FAISS,Elasticsearch、Milvus,MongoDB等向量数据
chat:
1、添加 语音回答输出
安装使用 Ollma安装,在如下网址选择适合你机器的ollama 安装包,傻瓜式安装即可
https://ollama.com/download
Ollama 安装模型,本次直接安装我们需要的两个 cmd中执行
ollama run qwen2:7b
ollama run mofanke/acge_text_embedding:latest
下载bge-reranker-large 模型然后在 rag/rerank.py中配置路径
https://hf-mirror.com/BAAI/bge-reranker-large
构造python环境
conda create -n Easy-RAG python=3.10.9
conda activate Easy-RAG
项目开发使用的 python3.10.9 经测试 pyhon3.8以上皆可使用
git clone https://github.com/yuntianhe2014/Easy-RAG.git
安装依赖
pip3 install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple
项目启动
python webui.py