Таблица содержит данные о 50 тыс. музыкальных композиций в следующих 10 жанрах:
'Electronic', 'Anime', 'Jazz', 'Alternative', 'Country', 'Rap', 'Blues', 'Rock', 'Classical', 'Hip-Hop'.
Список признаков:
- artist_name - Исполнитель
- track_name - Название копмозиции
- popularity - Рейтинг популярности
- acousticness - Насколько песня является акустической
- danceability - Танцевальность композиции
- duration_ms - Длительность (мс)
- energy - Энергичность песни
- instrumentalness - Вероятность того, что в треке нет вокала
- key - Тональность
- liveness - Вероятность того, что песня исполнялась вживую
- loudness - Громкость
- mode - Major / Minor
- speechiness - Содержание текста в песне
- tempo - Темп
- valence - Позитивность
- music_genre - жанр (необходимо предсказать)
Датасет, вероятно, был основан на данных Spotify (авторы явно не указывают источник), и все параметры трека (танцевальность, энергичность, акустичность и т.д.) вычислены алгоритмами Spotify, в подробности которых мы вдаваться не будем. Для нас это черный ящик, а наша задача - на основе переданных нам данных определить жанр композиции.