Номер | Название (+ссылка nbviewer) | Описание проекта | Используемые инструменты |
1 | Исследование надежности заемщиков | Заказчик — кредитный отдел банка. Нужно разобраться, влияет ли семейное положение и количество детей клиента на факт погашения кредита в срок. Входные данные от банка — статистика о платёжеспособности клиентов. Результаты исследования будут учтены при построении модели кредитного скоринга — специальной системы, которая оценивает способность потенциального заёмщика вернуть кредит банку. | pandas |
2 | Исследование объявлений о продаже квартир | Определение рыночной стоимости объектов недвижимости (на базе данных ресурса Яндекс.Недвижимость). Задача — установить параметры, которые в той или иной степени оказывают влиение на финальную стоимость. Это позволит построить автоматизированную систему: она отследит аномалии и мошенническую деятельность. | pandas |
3 | Определение перспективного тарифа для телеком-компании | Анализ тарифов мобильного оператора. Необходимо проанализировать поведение клиентов и сделать вывод — какой тариф лучше.В данном проекте я формулирую нулевую и альтернативную гипотезы, для проверки средней выручки между тарифами и регионами. | pandas, scipy |
4 | Сборный проект-1. Анализ игровой индустрии | Аналитика интернет-магазина игр для консолей и компьютеров. Необходимо выявить определяющие успешность игры закономерности. Это позволит сделать ставку на потенциально популярный продукт и спланировать рекламные кампании. | pandas, numpy, matplotlib, seaborn, scipy |
5 | Аналитика в авиакомпании | По двум датасетам произвести анализ по пунктам импортировать файлы;изучить данные в них; проверить типы данных на корректность; выбрать топ-10 городов по количеству рейсов; построить графики: модели самолетов и количество рейсов, города и количество рейсов, топ-10 городов и количество рейсов;сделать выводы по каждому из графиков, пояснить результат. | pandas, numpy, matplotlib, scipy, plotly.graph_objs, plotly.offline |
6 | Анализ бизнес-показателей | Стажировка в отделе аналитики Яндекс.Афиши. Задача: помочь маркетологам оптимизировать маркетинговые затраты. Расчет бизнес-метрик: Retention rate, Churn Rate, LTV, CAC, ROMI. | pandas, numpy, matplotlib, seaborn |
7 | Анализ результатов AB-теста | Вы — аналитик крупного интернет-магазина. Вместе с отделом маркетинга вы подготовили список гипотез для увеличения выручки.Приоритизируйте гипотезы, запустите A/B-тест и проанализируйте результаты. Применение фреймворков ICE, RICE. Построение куммулятивной конверсии. | pandas, numpy, matplotlib, scipy, plotly.graph_objs, plotly.offline, collections, datetime |
8 | Рынок заведений общественного питания Москвы | Исследование проекта для инвесторов по открытию небольшого кафе в Москве. Геовизуализация ресторанов Москвы и Московской области с применением API токена из Яндекс.Геокодер;Презентация по исследованию | pandas, numpy, matplotlib, scipy, API, plotly, geopandas, IFrame, HTML, folium, yaml, bokeh |
9 | Сборный проект-2. ААВ-тесты | ААВ-тестирование, множественное тестирование и применение поправок к полученным результатам. | pandas, numpy, matplotlib, scipy, plotly, math |
10 | Пайплайн для проекта Яндекс.Дзен; Дэшборд для проекта Яндекс.Дзен | В проекте подразумевается создание дэшборда для менеджеров, чтобы автоматизировать процесс отслеживания взаимодействия пользователей с карточками Яндекс.Дзена.Нужно было подключиться к виртуальной машине, через Яндекс.облако, после создать базу данных с помощью терминала, далее создать дата-пайплайн и после загрузить код дашборда. Работа выполняется на основе предоставленного технического задания;Описание реузльтатов дэшборда | postgresql, SQL, sqlalchemy, Яндекс.Облако, dash, sys, getopt, plotly, pandas |
11 | Проект по курсу Machine Learning | Сеть фитнес-центров разрабатывает стратегию взаимодействия с пользователями на основе аналитических данных. Задача проекта - провести анализ и подготовить план действий по удержанию клиентов. В данном проекте на основании метрик: Accuracy, Precision, Recall, F1, ROC_AUC выбираю подходящую модель прогнозирования из двух обученных: LogisticRegression и RandomForestClassifier. Так же делаю кластеризацию на основании построенной дендограммы и на оснвоании полученных кластеров строю гистограммы распределения, по которым делаю выводы и прогнозы. | pandas, seaborn, sklearn, scipy.cluster.hierarchy, sklearn.metrics plotly |
Номер | Название (+ссылка nbviewer) | Описание проекта | Используемые инструменты |
1 | Международный интернет_магазин A/B тест | Вам поступила аналитическая задача от международного интернет-магазина. Ваш предшественник не закончил её — запустил А/B-тест и уволился. Осталось только техническое задание и результаты теста. Загрузите данные теста, проверьте корректность его проведения и проанализируйте полученные результаты. | pandas, numpy, matplotlib, scipy, plotly, seaborn |
2 | Мини-проект SQL | Коронавирус застал мир врасплох, изменив привычный порядок вещей. В свободное время жители городов больше не выходят на улицу, не посещают кафе и торговые центры. Зато теперь они могут уделять больше времени книгам. На это обратили внимание стартаперы, которые бросились создавать новые приложения для тех, кто любит читать.¶ Вам передали базу данных одного из конкурирующих сервисов. В ней есть информация о книгах, издательствах, авторах, а также пользовательские обзоры на книги. Эти данные помогут сформулировать ценностное предложение для нового продукта. | pandas, sqlalchemy |
3 | Анализ мобильного приложения | Датасет содержит данные о событиях, совершенных в мобильном приложении "Ненужные вещи". В нем пользователи продают свои ненужные вещи, размещая их на доске объявлений.В датасете содержатся данные пользователей, впервые совершивших действия в приложении после 7 октября 2019 года. Выделите различающиеся по продуктовым метрикам (retention rate, время в приложении, частота совершения событий, конверсия с целевое действие contacts_show) группы пользователей на основе событий, которые они выполняют в мобильном приложении. Декомпозиция должна быть разработана самостоятельно и принята тимлидом. | pandas, numpy, matplotlib, scipy, plotly, seaborn |