You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
ML-For-Beginners/5-Clustering/translations/README.ko.md

3.0 KiB

머신러닝을 위한 Clustering 모델

Clustering은 서로 비슷한 오브젝트를 찾고 clusters라고 불린 그룹으로 묶는 머신러닝 작업입니다. Clustering이 머신러닝의 다른 접근법과 다른 점은, 자동으로 어떤 일이 생긴다는 것이며, 사실은, supervised learning의 반대라고 말하는 게 맞습니다.

지역 토픽: 나이지리아 사람들의 음악 취향을 위한 clustering 모델 🎧

나이지리아의 다양한 사람들은 다양한 음악 취향이 있습니다. Spotify에서 긁어온 데이터를 사용해서 (this article에서 영감받았습니다), 나이지니아에서 인기있는 음악을 알아보겠습니다. 데이터셋에 다양한 노래의 'danceability' 점수, 'acousticness', loudness, 'speechiness', 인기도와 에너지 데이터가 포함됩니다. 데이터에서 패턴을 찾는 것은 흥미로울 예정입니다!

A turntable

Photo by Marcela Laskoski on Unsplash

이 강의의 시리즈에서, clustering 기술로 데이터를 분석하는 새로운 방식을 찾아볼 예정입니다. Clustering은 데이터셋에 라벨이 없으면 더욱 더 유용합니다. 만약 라벨이 있다면, 이전 강의에서 배운대로 classification 기술이 더 유용할 수 있습니다. 그러나 라벨링되지 않은 데이터를 그룹으로 묶으려면, clustering은 패턴을 발견하기 위한 좋은 방식입니다.

clustering 모델 작업을 배울 때 도움을 받을 수 있는 유용한 low-code 도구가 있습니다. Azure ML for this task를 시도해봅니다.

강의

  1. clustering 소개하기
  2. K-Means clustering

크레딧

These lessons were written with 🎶 by Jen Looper with helpful reviews by Rishit Dagli and Muhammad Sakib Khan Inan.

Nigerian Songs 데이터셋은 Spotify 스크랩해서 Kaggle에서 가져왔습니다.

이 강의를 만들 때 도움된 유용한 K-Means 예시는 iris exploration, introductory notebook, 과 hypothetical NGO example이 포함됩니다.