3.0 KiB
Modelli di clustering per machine learning
Il clustering è un'attività di machine learning che cerca di trovare oggetti che si assomigliano per raggrupparli in gruppi chiamati cluster. Ciò che differenzia il clustering da altri approcci in machine learning è che le cose accadono automaticamente, infatti, è giusto dire che è l'opposto dell'apprendimento supervisionato.
Tema regionale: modelli di clustering per il gusto musicale di un pubblico nigeriano 🎧
Il pubblico eterogeneo della Nigeria ha gusti musicali diversi. Usando i dati recuperati da Spotify (ispirato da questo articolo, si dà un'occhiata a un po' di musica popolare in Nigeria. Questo insieme di dati include dati sul punteggio di "danzabilità", acustica, volume, "speechness" (un numero compreso tra zero e uno che indica la probabilità che un particolare file audio sia parlato - n.d.t.) popolarità ed energia di varie canzoni. Sarà interessante scoprire modelli in questi dati!
Foto di Marcela Laskoski su Unsplash
In questa serie di lezioni si scopriranno nuovi modi per analizzare i dati utilizzando tecniche di clustering. Il clustering è particolarmente utile quando l'insieme di dati non ha etichette. Se ha etichette, le tecniche di classificazione come quelle apprese nelle lezioni precedenti potrebbero essere più utili. Ma nei casi in cui si sta cercando di raggruppare dati senza etichetta, il clustering è un ottimo modo per scoprire i modelli.
Esistono utili strumenti a basso codice che possono aiutare a imparare a lavorare con i modelli di clustering. Si provi Azure ML per questa attività
Lezioni
Crediti
Queste lezioni sono state scritte con 🎶 da Jen Looper con utili recensioni di Rishit Dagli e Muhammad Sakib Khan Inan.
L'insieme di dati Nigerian Songs è stato prelevato da Kaggle, a sua volta recuperato da Spotify.
Esempi utili di K-Means che hanno aiutato nella creazione di questa lezione includono questa esplorazione dell'iride, questo notebook introduttivo e questo ipotetico esempio di ONG.