Skip to content

edubskiy/aivi

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 

Repository files navigation

AIVI

AIVI — это инновационный проект, направленный на создание мощного голосового ассистента, который поможет пользователям находить и примерять одежду онлайн с помощью искусственного интеллекта и дополненной реальности. Проект ориентирован на разработчиков, интересующихся созданием интерактивных голосовых помощников и интеграцией технологий виртуальной примерочной для улучшения онлайн-шопинга.

Описание проекта

AIVI использует передовые технологии для создания голосового ассистента, который помогает пользователям находить подходящую одежду и обувь, основываясь на их запросах, параметрах тела и предпочтениях. Ассистент способен распознавать речь, искать подходящие товары в базе данных или интернет-магазинах, а также рекомендовать размеры и стили. Виртуальная примерочная с использованием дополненной реальности (AR) позволит пользователям примерить одежду перед покупкой, что улучшит пользовательский опыт и снизит количество возвратов.

Основные особенности:

  • ASR (Automatic Speech Recognition): Преобразование речи в текст с использованием таких технологий, как Whisper (OpenAI) или Google Speech-to-Text API.
  • RAG (Retrieval-Augmented Generation): Интеллектуальный поиск информации о товарах (одежда, обувь, аксессуары) на основе предпочтений пользователя и его тела.
  • LLM (Large Language Model): Использование моделей GPT-4 или Llama 2 для персонализированных рекомендаций, основанных на запросах пользователя.
  • TTS (Text-to-Speech): Преобразование сгенерированных ответов в речь, создавая интуитивное взаимодействие с пользователем.
  • AR (Augmented Reality): Возможность виртуальной примерки одежды с использованием дополненной реальности.

Технологии:

  • ASR: Whisper (OpenAI) / Google Speech-to-Text API
  • RAG: HuggingFace, Elasticsearch
  • LLM: GPT-4 / Llama 2
  • TTS: Tacotron 2 / Google Text-to-Speech
  • AR: Unity с ARFoundation или WebAR с использованием A-Frame/Three.js
  • Языки разработки: Python, JavaScript
  • Фреймворки: Flask, FastAPI, Node.js

Установка и запуск

  1. Клонируйте репозиторий:

    git clone https://github.com/yourusername/AIVI.git
  2. Установите зависимости:

    pip install -r requirements.txt
  3. Настройте API ключи для ASR, RAG, TTS и AR в файле .env.

  4. Запустите проект:

    python app.py

Цели проекта

Мы стремимся создать голосового ассистента для онлайн-шопинга, который использует технологии искусственного интеллекта и дополненной реальности для персонализированного подбора и виртуальной примерки одежды. AIVI станет вашим надежным помощником при покупках, помогая находить идеально подходящие товары, снижая количество возвратов и улучшая общий опыт шопинга.

Присоединяйтесь к команде

AIVI — это открытый проект, и мы приглашаем вас стать частью нашей команды! Если вам интересна работа с RAG, LLM, ASR, TTS или технологиями дополненной реальности, давайте вместе изменим будущее онлайн-шопинга. Свяжитесь со мной @edubskiy, если хотите присоединиться к этому амбициозному проекту!

Лицензия

Этот проект лицензирован под лицензией MIT. Более подробную информацию смотрите в файле LICENSE.

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published