My study projects @ YandexPracticum
Данныйе проекты были выполнены в ходе обучения в Яндекс.Практикуме, профессия "Специалист по Data Science".
Название проекта | Описание | Используемые библиотеки |
---|---|---|
Музыка больших городов | Сравнение предпочтений пользователей Яндекс.Музыки из Москвы и Санкт-Петербурга в зависимости от времени (утро и вечер) и дня недели (понедельник, среда, пятница) | pandas |
Исследование надёжности заёмщиков | Построение модели кредитного скоринга в зависимости от семейного положения и количества детей у заёмщика | pandas, matplotlib, os, collections, pymystem3 |
Исследование объявлений о продаже квартир | Определение параметров для построения автоматизированной системы, отслеживающей аномалии и мошенническую деятельность на рынке недвижимои Санкт-Петербурга. | pandas, matplotlib, os, numpy, re |
Определение перспективного тарифа для телеком-компании | Анализ поведения клиентов оператора сотовой связи и определение наиболее перспективного тарифа для корректировки рекламного бюджета | pandas, matplotlib, os, numpy, re, math, scipy |
Определение закономерностей, определяющих успешность игр | Выявление закономерностей, определяющих успешность игры на рынке для выявления наиболее перспективных продуктов и планирования рекламных кампаний | pandas, matplotlib, os, numpy, re, math, scipy, seaborn |
Рекомендательная система на основе модели классификации для пользователей телеком-компании | Построение модели для задачи классификации, которая выберет и предложит пользователю наиболее подходящий тариф | pandas, matplotlib, os, numpy, seaborn, sklearn |
Построение модели предсказания оттока клиентов банка с предельно большим значением F1-меры | Построение модели для прогнозирования оттока клиентов на основе исторических данных | pandas, matplotlib, os, numpy, re, seaborn, sklearn (модули: linear_model, tree, ensemble, preprocessing, metrics, model_selection, utils) |
Предсказание прибыльности и рисков для скважин | Предсказание прибыльности скважин на основе анализа возможных прибылей и рисков техникой Bootstrap | pandas, matplotlib, os, numpy, seaborn, sklearn (модули: linear_model, model_selection) |
Восстановление золота из руды | Построение модели, предсказывающей коэффициент восстановления золота из золотосодержащей руды | pandas, matplotlib, os, numpy, seaborn, sklearn (модули: linear_model, tree, ensemble, metrics, model_selection) |
Защита персональных данных | Разработка метода преобразования данных, усложняющего восстановление персональной информацию, но не ухудшающего качество моделей машинного обучения | pandas, matplotlib, os, numpy, seaborn, sklearn (модули: linear_model, metrics, model_selection) |
Модель определения стоимости автомобиля | Построение модели для определения стоимости автомобиля с оптимизацией качества предсказания, скорости предсказания и времения обучения | pandas, time, datetime, os, numpy, math, matplotlib, seaborn, sklearn (модули: linear_model, tree, ensemble, pipeline, metrics, preprocessing, model_selection), xgboost, lightgbm, catboost |
Модель для прогнозирования количества заказов такси на следующий час | Построение модели для прогнозирования количества заказов такси на следующий час на основании исторических данных | pandas, time, datetime, os, numpy, math, matplotlib, seaborn, sklearn (модули: linear_model, tree, ensemble, pipeline, metrics, preprocessing, model_selection, pipeline), xgboost, lightgbm, catboost, pmdarima, statsmodels |
Модель классификации комментариев | Построение модели для классификации комментариев пользователей (классические модели ML) | pandas, time, datetime, os, numpy, math, matplotlib, seaborn, sklearn (модули: linear_model, tree, ensemble, pipeline, metrics, preprocessing, model_selection, feature_extraction), catboost |
Модель для определения возрастапо фото пользователя | Построение модели для определения возраста пользователей по фото (Tensorflow) | random, numpy, pandas, matplotlib, PIL, tensorflow |
Модель для прогнозирования температуры стали | Построение модели для прогнозирования температуры стали в целях оптимизации производственных расходов сталелитейного предприятия | pandas, time, datetime, warnings, numpy, seaborn, matplotlib, sklearn (модули: model_selection, preprocessing, metrics, linear_model, tree, ensemble, neighbors), lightgbm, xgboost |