Для хранения проектов созданных в процессе обучения в Яндекс.Практикум по профессии "Аналитик данных"
Контакты: [email protected]
Disclaimer: по политике Яндекс.Практикум файлы с данными отсутствуют
pandas
numpy
requests
pymystem3
matplotlib.pyplot
math
seaborn
scipy
sklearn
sidetable
sqlalchemy
datetime
plotly.express
plotly
collections
Проект | Описание | Инструменты |
---|---|---|
1. Предобработка данных, исследование надёжности заёмщиков банка | На основе статистики о платёжеспособности клиентов исследовать влияет ли семейное положение и количество детей клиента на факт возврата кредита в срок | обработка данных (в т.ч. дубликаты, пропуски), категоризация, лемматизация |
2. Исследовательский анализ данных, исследование объявлений о продаже квартир | Используя данные сервиса Яндекс.Недвижимость, определить рыночную стоимость объектов недвижимости и типичные параметры квартир | обработка данных, категоризация, histogram, boxplot, scattermatrix, scatterplot, срезы данных, определение и интерпритация взаимосвязи различных данных, автоматизация процесса построения графиков |
3. Статистический анализ данных, определение перспективного тарифа для телеком компании | На основе данных клиентов оператора сотовой связи проанализировать поведение клиентов и поиск оптимального тарифа | обработка данных, histogram, boxplot, статистический тест, критерий Стьюдента |
4. Сборный проект, параметры успешной игры | Используя исторические данные о продажах компьютерных игр, оценки пользователей и экспертов, жанры и платформы, выявить закономерности, определяющие успешность игры | Отработка навыков из предыдущих спринтов |
5. Сбор и хранение данных | Произвести выгрузки и подготовку данных авиакомпаний с помощью SQL, проверить гипотезу о различии среднего спроса на билеты во время различных событий | критерий Стьюдента, SQL-запросы разной сложности, регулярные выражения, срезы данных и подзапросы, работать с документацией SQL и агрегирующими функциями, объединение таблиц разными методами |
6. Анализ бизнес-показателей, аналитика в Яндекс.Афише | На основе данных о посещениях сайта Яндекс.Афиши изучить, как люди пользуются продуктом, когда они начинают покупать, сколько денег приносит каждый клиент, когда он окупается | расчет окупаемости бизнеса и возврата маркетинговых инвестиций, построение маркетинговых и продуктовых воронок средствами Python, когортный анализ, расчет метрик (LTV, CAC, Retention rate, DAU, WAU, MAU, ROMI), вычесление экономики одной продажи / одной покупки, измерение пользовательской активность, работа с данными API Яндекс Метрики |
7. Принятие решений в бизнесе на основе данных, А/В тесты | Используя данные интернет-магазина приоритезировать гипотезы, произвести оценку результатов A/B-тестирования различными методами | A/B-тест, Статистический тест |
8. Как рассказать историю с помощью данных, рынок заведений общественного питания Москвы | Исследование рынка общественного питания на основе открытых данных, подготовка презентации для инвесторов | API, Парсинг, BeautifulSoup, Визуализация |
9. Сборный проект- 2, анализ пользовательского поведения в мобильном приложении | На основе данных использования мобильного приложения для продажи продуктов питания проанализировать воронку продаж, а также оценить результаты A/A/B-тестирования | аналитика мобильного приложения / продукта, A/B-тест, визуализация, статистический тест |
10. Автоматизация, создание дашборда по пользовательским событиям | Используя данные Яндекс.Дзена построить дашборд с метриками взаимодействия пользователей с карточками статей | дашборд, пайплайн, Yandex.Cloud, удаленный сервер, виртуальная машина, cron |
11. Прогнозы и предсказания, прогнозирование вероятности оттока пользователей для фитнес-центров | На основе данных о посетителях сети фитнес-центров спрогнозировать вероятность оттока для каждого клиента в следующем месяце, сформировать с помощью кластеризации портреты пользователей | Machine Learning, Классификация, кластеризации, KMeans, дендрограмма, RandomForestClassifier, LogisticRegression |