Skip to content

sergkh/data-mining-course

Repository files navigation

Data Mining Datasets

cars.csv

Набір даних про споживання пального для різних марок автомобілів з їх характеристиками.

games_sales.csv

Містить інформацію про продажі відеоігор в різних регіонах світу. Поділено по року, видавцю, жанру та платформам. Продажі задані в мільйонах екземплярів.

heart.csv

Інформація про пацієнтів, для визначення ризику ішемічної хвороби серця.

diabetes.csv

Дані національного інституту діабету, захворювань органів травлення та нирок». Усі пацієнти тут належать до індіанської спадщини піма (підгрупа корінних американців) і є жінками віком від 21 року.

roast.csv

Дані по обжарці кави, задані температурою та часом обжарювання й відповідно чи результат був успішним чи ні.

digits01

Рукописні цифри 0-1, в форматі numpy array.

ice_cream.csv

Дані про продажі морозива в залежності від температури. Підходять для вивчення поліноміальної регресії.

cat-dogs.tar

Спрощена версія датасету з Kaggle, що містить зображення котів та собак.

students.csv

Дані про оцінки студентів, їх вік, стать, робота на парах та оцінка.

creditcard.tar.gz

Дані про транзакції з кредитних карт з сайту Kaggle. Містить транзакції за 2013 рік зроблені в Європі, серед яких є 492 шахрайські транзакції з 284807 транзакцій (0.172% з усіх транзакцій). Дані містять тільки числові характеристики, які були згенеровані за допомогою алгоритму PCA, з оригінальних значень, тому в них немає ніякої інтерпретації. Це зроблено, в тому числі, для збереження конфіденційності транзакцій. Єдині дані, які не були перетворені це час (відносний) та суми транзакцій.

network.tar.gz

Спрощені дані з KDD Cup 1999 Data

tweets.tar.gz

Твіти з твіттеру для аналізу сентиментів.

About

Datasets for data mining course

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published