Команда: "сомнительно, но окей"
Цифровой прорыв 2024 31.05-02.06
Кейс: "Разработка QnA бота Тинькофф Помощь – Бизнес"
https://evident-jolly-primate.ngrok-free.app/assist
ПРИМЕР ЗАПРОСА
curl -X POST -H "Content-Type: application/json" -d '{"query": "Как выпустить бизнес-карту?"}' https://evident-jolly-primate.ngrok-free.app/assist
- train.ipynb - код обучения модели
- interact_llama3_llamacpp.py - файл инференса модели
- requirements.txt - нужные библиотеки для инференса
- api - папка для поднятия сервера FastAPI
- бот - папка с телеграм ботом https://huggingface.co/artemgoncarov/saiga_llama_8b_tinkoff/ - ссылка на модельку ( скачивайте ггуф формат модельки)
- Скачивайте папку апи( модельку кладете в ту же папку)
- Инсталлите все что нужно (скачиваете ngrok)
- pip install spacy uvicorn
- py -m spacy download ru_core_news_lg
- Открываете консоль в папке и пишите:
- py -m llama_cpp.server --model model-unsloth.Q4_K_M.gguf
- py -m llama_cpp.server --model model-unsloth.Q4_K_M.gguf
- uvicorn main:app --reload --port 1488
- ngrok http http://localhost:1488
- Пример запроса curl -X POST -H "Content-Type: application/json" -d '{"query": "Кто может выпустить бизнес-карту?"}' https://d77f-77-34-223-214.ngrok-free.app/assist ( вместо https://d77f-77-34-223-214.ngrok-free.app указываете вашу ссылку ngrok)
- Сигалов Константин
- Беляев Матвей
- Гончаров Артем