RagFlow是一个基于 LLM 的问答系统,能够快速构建智能问答平台。然而,RagFlow 默认的知识库上传界面存在一些局限性:每次只能上传有限数量的文件,并且上传后还需手动启动解析流程,当需要上传大量文件时,这样的操作便显得有些繁琐。
为了简化这一过程,我编写了一个脚本,该脚本可以遍历指定目录,自动逐个将文档上传至 RagFlow 知识库,并立即启动解析。当一个文档解析完成后,脚本将自动上传并解析下一个文档。特别是在需要上传大量文件时,这显著减少了人工干预,避免了手动分批上传和解析的等待时间。
(例如,我自己需要将mac中所有备忘录内容导入到知识库中查询)
conda create -n ragflow-upload python=3.10.13 -y
pip install -r requirements.txt
复制并配置ragflows/configs.py
关于配置文件的说明可参考这个:issues #2
cp ragflows/configs.demo.py ragflows/configs.py
python ragflows/main.py