Llama server

Rest API Server for Llama 2

Prerequisite

Before run this server, you have to download Llama 2 model first.

Move ggsm model file to models/7B/ggml-model-q4_0.bin (default MODEL_PATH)

pip3 install llama-cpp-python langchain
pip3 install fastapi uvicorn

python3 server.py

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
models/7B		models/7B
tokens		tokens
.gitignore		.gitignore
README.md		README.md
server.py		server.py