Skip to content

Iskanderrus/DS-YandexPracticum

Repository files navigation

DS-YandexPracticum

My study projects @ YandexPracticum

Описание проектов курса "Специалист по Data Science"

Данныйе проекты были выполнены в ходе обучения в Яндекс.Практикуме, профессия "Специалист по Data Science".

Название проекта Описание Используемые библиотеки
Музыка больших городов Сравнение предпочтений пользователей Яндекс.Музыки из Москвы и Санкт-Петербурга в зависимости от времени (утро и вечер) и дня недели (понедельник, среда, пятница) pandas
Исследование надёжности заёмщиков Построение модели кредитного скоринга в зависимости от семейного положения и количества детей у заёмщика pandas, matplotlib, os, collections, pymystem3
Исследование объявлений о продаже квартир Определение параметров для построения автоматизированной системы, отслеживающей аномалии и мошенническую деятельность на рынке недвижимои Санкт-Петербурга. pandas, matplotlib, os, numpy, re
Определение перспективного тарифа для телеком-компании Анализ поведения клиентов оператора сотовой связи и определение наиболее перспективного тарифа для корректировки рекламного бюджета pandas, matplotlib, os, numpy, re, math, scipy
Определение закономерностей, определяющих успешность игр Выявление закономерностей, определяющих успешность игры на рынке для выявления наиболее перспективных продуктов и планирования рекламных кампаний pandas, matplotlib, os, numpy, re, math, scipy, seaborn
Рекомендательная система на основе модели классификации для пользователей телеком-компании Построение модели для задачи классификации, которая выберет и предложит пользователю наиболее подходящий тариф pandas, matplotlib, os, numpy, seaborn, sklearn
Построение модели предсказания оттока клиентов банка с предельно большим значением F1-меры Построение модели для прогнозирования оттока клиентов на основе исторических данных pandas, matplotlib, os, numpy, re, seaborn, sklearn (модули: linear_model, tree, ensemble, preprocessing, metrics, model_selection, utils)
Предсказание прибыльности и рисков для скважин Предсказание прибыльности скважин на основе анализа возможных прибылей и рисков техникой Bootstrap pandas, matplotlib, os, numpy, seaborn, sklearn (модули: linear_model, model_selection)
Восстановление золота из руды Построение модели, предсказывающей коэффициент восстановления золота из золотосодержащей руды pandas, matplotlib, os, numpy, seaborn, sklearn (модули: linear_model, tree, ensemble, metrics, model_selection)
Защита персональных данных Разработка метода преобразования данных, усложняющего восстановление персональной информацию, но не ухудшающего качество моделей машинного обучения pandas, matplotlib, os, numpy, seaborn, sklearn (модули: linear_model, metrics, model_selection)
Модель определения стоимости автомобиля Построение модели для определения стоимости автомобиля с оптимизацией качества предсказания, скорости предсказания и времения обучения pandas, time, datetime, os, numpy, math, matplotlib, seaborn, sklearn (модули: linear_model, tree, ensemble, pipeline, metrics, preprocessing, model_selection), xgboost, lightgbm, catboost
Модель для прогнозирования количества заказов такси на следующий час Построение модели для прогнозирования количества заказов такси на следующий час на основании исторических данных pandas, time, datetime, os, numpy, math, matplotlib, seaborn, sklearn (модули: linear_model, tree, ensemble, pipeline, metrics, preprocessing, model_selection, pipeline), xgboost, lightgbm, catboost, pmdarima, statsmodels
Модель классификации комментариев Построение модели для классификации комментариев пользователей (классические модели ML) pandas, time, datetime, os, numpy, math, matplotlib, seaborn, sklearn (модули: linear_model, tree, ensemble, pipeline, metrics, preprocessing, model_selection, feature_extraction), catboost
Модель для определения возрастапо фото пользователя Построение модели для определения возраста пользователей по фото (Tensorflow) random, numpy, pandas, matplotlib, PIL, tensorflow
Модель для прогнозирования температуры стали Построение модели для прогнозирования температуры стали в целях оптимизации производственных расходов сталелитейного предприятия pandas, time, datetime, warnings, numpy, seaborn, matplotlib, sklearn (модули: model_selection, preprocessing, metrics, linear_model, tree, ensemble, neighbors), lightgbm, xgboost

About

My study projects @ YandexPracticum

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published