4.4 KiB
Модели кластеризации для машинного обучения
Кластеризация - это задача машинного обучения, при которой она ищет объекты, которые похожи друг на друга, и группирует их в группы, называемые кластерами. Что отличает кластеризацию от других подходов в машинном обучении, так это то, что все происходит автоматически, и справедливо сказать, что это противоположность supervised learning.
Региональная тема: модели кластеризации для музыкальных вкусов нигерийской публики 🎧
У разнообразной публики Нигерии самые разные музыкальные вкусы. Использование данных, извлеченных из Spotify (на основе этой статьи, давайте посмотрим на музыку, популярную в Нигерии. Этот набор данных включает данные о различных песнях "танцевальность", "акустичность", "громкость", "речевость", "популярность" и "энергия". Будет интересно обнаружить закономерности в этих данных!
Фото Марсела Ласкоски на Unsplash
В этой серии уроков вы откроете для себя новые способы анализа данных с помощью методов кластеризации. Кластеризация особенно полезна, когда в наборе данных отсутствуют метки. Если на нем есть ярлыки, тогда могут быть более полезными методы классификации, подобные тем, которые вы изучили на предыдущих уроках. Но в случаях, когда вы хотите сгруппировать немаркированные данные, кластеризация - отличный способ обнаружить закономерности.
Существуют полезные инструменты с небольшим количеством кода, которые могут помочь вам узнать о работе с моделями кластеризации. Попробуйте Azure ML для этой задачи
Уроки
Благодарности
Эти уроки были написаны с помощью 🎶 Джен Лупер с полезными отзывами Ришит Дагли и Мухаммад Сакиб Хан Инан.
Набор данных Нигерийские песни был получен из Kaggle, как и из Spotify.
Полезные примеры K-Means, которые помогли в создании этого урока, включают исследование радужной оболочки глаза, вводный блокнот и пример гипотетической НПО.