Набір даних про споживання пального для різних марок автомобілів з їх характеристиками.
Містить інформацію про продажі відеоігор в різних регіонах світу. Поділено по року, видавцю, жанру та платформам. Продажі задані в мільйонах екземплярів.
Інформація про пацієнтів, для визначення ризику ішемічної хвороби серця.
Дані національного інституту діабету, захворювань органів травлення та нирок». Усі пацієнти тут належать до індіанської спадщини піма (підгрупа корінних американців) і є жінками віком від 21 року.
Дані по обжарці кави, задані температурою та часом обжарювання й відповідно чи результат був успішним чи ні.
Рукописні цифри 0-1, в форматі numpy array.
Дані про продажі морозива в залежності від температури. Підходять для вивчення поліноміальної регресії.
Спрощена версія датасету з Kaggle, що містить зображення котів та собак.
Дані про оцінки студентів, їх вік, стать, робота на парах та оцінка.
Дані про транзакції з кредитних карт з сайту Kaggle. Містить транзакції за 2013 рік зроблені в Європі, серед яких є 492 шахрайські транзакції з 284807 транзакцій (0.172% з усіх транзакцій). Дані містять тільки числові характеристики, які були згенеровані за допомогою алгоритму PCA, з оригінальних значень, тому в них немає ніякої інтерпретації. Це зроблено, в тому числі, для збереження конфіденційності транзакцій. Єдині дані, які не були перетворені це час (відносний) та суми транзакцій.
Спрощені дані з KDD Cup 1999 Data
Твіти з твіттеру для аналізу сентиментів.