🚀 Tutorial en Español | Youtube
¿Qué es una base de datos vectorial? En este taller, exploraremos ChromaDB, una de las bases de datos vectoriales líderes de código abierto. Este tipo de bases de datos ha ganado una gran popularidad en los últimos meses. ¿Son realmente útiles? Lo comprobaremos en el tutorial paso a paso.
Además, ¿sabías que ChatGPT puede mantener conversaciones con documentos? En este taller de Python, descubriremos cómo hacerlo posible gracias a ChromaDB. Olvídate de las limitaciones, ahora podrás conversar y explorar tus documentos de una manera completamente nueva.
Para desarrollar esta aplicación necesitaremos:
- Docker
- ChatGPT API
- Streamlit
- Divide documento en cachos (o chunks)
- Crea los embeddings de los cachos de texto
- Guarda los cachos y los embeddings en ChromaDB
- Busca los cachos más similares a la pregunta del usuario gracias a los embeddings.
- Pasa los cachos más similares junto a la pregunta a ChatGPT que genera la respuesta
¡Usar este código es fácil! Aquí están los pasos:
- Clone o descargue el repositorio en su máquina local.
- Instale las bibliotecas requeridas ejecutando el siguiente comando en su terminal:
pip install -r requirements.txt
- Obtenga una clave API de OpenAI para usar su API ChatGPT.
- Instale ChromaDB o despliegue con Docker
- Ejecute la aplicación con el siguiente comando:
streamlit run app.py
- Suba un documento a la aplicación.
- Escriba su pregunta y disfrute de la magia.