4.4 KiB
Модели кластеризации для машинного обучения
Кластеризация - это задача машинного обучения, в которой происходит поиск похожих друг на друга объектов и объединение их в группы, называемые кластерами. Что отличает кластеризацию от других подходов в машинном обучении, так это то, что все происходит автоматически, и справедливо будет сказать, что это противоположность обучению с учителем.
Региональная тема: модели кластеризации для музыкальных вкусов нигерийской публики 🎧
Разнообразная публика Нигерии имеет самые разные музыкальные вкусы. Используя данные, полученные от Spotify (на основе этой статьи, давайте посмотрим на популярную музыку в Нигерии. Этот набор данных включает данные о "танцевальности", "акустичности", громкости, "разговорчивости", популярности и энергии различных песен. Будет интересно обнаружить закономерности в этих данных!
Фото Марсела Ласкоски на Unsplash
В этой серии уроков вы откроете для себя новые способы анализа данных с помощью методов кластеризации. Кластеризация особенно полезна, когда в наборе данных отсутствуют метки. Если в нем есть метки, тогда могут быть более полезными методы классификации, подобные тем, которые вы изучили на предыдущих уроках. Но в случаях, когда вы хотите сгруппировать данные без меток, кластеризация - отличный способ обнаружить закономерности.
Существуют инструменты, не требующие написания большого количества кода, которые могут помочь вам узнать о моделях кластеризации. Попробуйте Azure ML для этой задачи.
Уроки
Благодарности
Эти уроки были написаны Джен Лупер с 🎶 и полезными комментариями от Ришит Дагли и Мухаммад Сакиб Хан Инан.
Набор данных Нигерийские песни был получен из Kaggle как спаршенный со Spotify.
Полезные примеры K-средних, которые помогли в создании этого урока, включают исследование цветков ирисов, вводный блокнот и пример гипотетической НПО.