{ "nbformat": 4, "nbformat_minor": 0, "metadata": { "anaconda-cloud": "", "kernelspec": { "display_name": "R", "language": "R", "name": "ir" }, "language_info": { "codemirror_mode": "r", "file_extension": ".r", "mimetype": "text/x-r-source", "name": "R", "pygments_lexer": "r", "version": "3.4.1" }, "colab": { "name": "lesson_14.ipynb", "provenance": [], "collapsed_sections": [], "toc_visible": true }, "coopTranslator": { "original_hash": "ad65fb4aad0a156b42216e4929f490fc", "translation_date": "2025-08-29T23:37:13+00:00", "source_file": "5-Clustering/2-K-Means/solution/R/lesson_15-R.ipynb", "language_code": "ru" } }, "cells": [ { "cell_type": "markdown", "metadata": { "id": "GULATlQXLXyR" }, "source": [ "## Изучение кластеризации методом K-Means с использованием R и принципов \"tidy data\"\n", "\n", "### [**Тест перед лекцией**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/29/)\n", "\n", "В этом уроке вы научитесь создавать кластеры с использованием пакета Tidymodels и других пакетов из экосистемы R (назовем их друзьями 🧑🤝🧑), а также набора данных о нигерийской музыке, который вы импортировали ранее. Мы рассмотрим основы метода K-Means для кластеризации. Помните, как вы узнали в предыдущем уроке, существует множество способов работы с кластерами, и выбор метода зависит от ваших данных. Мы попробуем метод K-Means, так как это наиболее распространенная техника кластеризации. Давайте начнем!\n", "\n", "Термины, с которыми вы познакомитесь:\n", "\n", "- Оценка силуэта (Silhouette scoring)\n", "\n", "- Метод локтя (Elbow method)\n", "\n", "- Инерция (Inertia)\n", "\n", "- Дисперсия (Variance)\n", "\n", "### **Введение**\n", "\n", "[Кластеризация методом K-Means](https://wikipedia.org/wiki/K-means_clustering) — это метод, происходящий из области обработки сигналов. Он используется для разделения и группировки данных на `k кластеров` на основе сходства их характеристик.\n", "\n", "Кластеры можно визуализировать как [диаграммы Вороного](https://wikipedia.org/wiki/Voronoi_diagram), которые включают точку (или \"семя\") и соответствующую ей область.\n", "\n", "
\n",
" \n",
"
\n",
" \n",
"
\n",
" \n",
"
\n",
" \n",
"