{ "nbformat": 4, "nbformat_minor": 0, "metadata": { "anaconda-cloud": "", "kernelspec": { "display_name": "R", "language": "R", "name": "ir" }, "language_info": { "codemirror_mode": "r", "file_extension": ".r", "mimetype": "text/x-r-source", "name": "R", "pygments_lexer": "r", "version": "3.4.1" }, "colab": { "name": "lesson_14.ipynb", "provenance": [], "collapsed_sections": [], "toc_visible": true }, "coopTranslator": { "original_hash": "ad65fb4aad0a156b42216e4929f490fc", "translation_date": "2025-08-29T19:23:24+00:00", "source_file": "5-Clustering/2-K-Means/solution/R/lesson_15-R.ipynb", "language_code": "pa" } }, "cells": [ { "cell_type": "markdown", "metadata": { "id": "GULATlQXLXyR" }, "source": [ "## R ਅਤੇ Tidy ਡਾਟਾ ਸਿਧਾਂਤਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ K-Means ਕਲੱਸਟਰਿੰਗ ਦੀ ਪੜਚੋਲ ਕਰੋ\n", "\n", "### [**ਪ੍ਰੀ-ਲੈਕਚਰ ਕਵਿਜ਼**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/29/)\n", "\n", "ਇਸ ਪਾਠ ਵਿੱਚ, ਤੁਸੀਂ ਸਿੱਖੋਗੇ ਕਿ R ਇਕੋਸਿਸਟਮ ਵਿੱਚ Tidymodels ਪੈਕੇਜ ਅਤੇ ਹੋਰ ਪੈਕੇਜ (ਜਿਨ੍ਹਾਂ ਨੂੰ ਅਸੀਂ ਦੋਸਤ ਕਹਾਂਗੇ 🧑🤝🧑) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਕਲੱਸਟਰ ਕਿਵੇਂ ਬਣਾਉਣੇ ਹਨ, ਅਤੇ ਨਾਈਜੀਰੀਆਈ ਮਿਊਜ਼ਿਕ ਡਾਟਾਸੈੱਟ ਜੋ ਤੁਸੀਂ ਪਹਿਲਾਂ ਇੰਪੋਰਟ ਕੀਤਾ ਸੀ। ਅਸੀਂ ਕਲੱਸਟਰਿੰਗ ਲਈ K-Means ਦੇ ਬੁਨਿਆਦੀ ਸਿਧਾਂਤਾਂ ਨੂੰ ਕਵਰ ਕਰਾਂਗੇ। ਯਾਦ ਰੱਖੋ, ਜਿਵੇਂ ਤੁਸੀਂ ਪਹਿਲੇ ਪਾਠ ਵਿੱਚ ਸਿੱਖਿਆ ਸੀ, ਕਲੱਸਟਰਾਂ ਨਾਲ ਕੰਮ ਕਰਨ ਦੇ ਕਈ ਤਰੀਕੇ ਹਨ ਅਤੇ ਤੁਸੀਂ ਜੋ ਤਰੀਕਾ ਵਰਤਦੇ ਹੋ ਉਹ ਤੁਹਾਡੇ ਡਾਟਾ 'ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ। ਅਸੀਂ K-Means ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਾਂਗੇ ਕਿਉਂਕਿ ਇਹ ਸਭ ਤੋਂ ਆਮ ਕਲੱਸਟਰਿੰਗ ਤਕਨੀਕ ਹੈ। ਚਲੋ ਸ਼ੁਰੂ ਕਰੀਏ!\n", "\n", "ਤੁਸੀਂ ਜਿਨ੍ਹਾਂ ਸ਼ਬਦਾਂ ਬਾਰੇ ਸਿੱਖੋਗੇ:\n", "\n", "- ਸਿਲਹੂਏਟ ਸਕੋਰਿੰਗ \n", "- ਐਲਬੋ ਮੈਥਡ \n", "- ਇਨਰਸ਼ੀਆ \n", "- ਵੈਰੀਅੰਸ \n", "\n", "### **ਪ੍ਰਸਤਾਵਨਾ**\n", "\n", "[K-Means ਕਲੱਸਟਰਿੰਗ](https://wikipedia.org/wiki/K-means_clustering) ਇੱਕ ਤਰੀਕਾ ਹੈ ਜੋ ਸਿਗਨਲ ਪ੍ਰੋਸੈਸਿੰਗ ਦੇ ਖੇਤਰ ਤੋਂ ਆਇਆ ਹੈ। ਇਹ ਡਾਟਾ ਦੇ ਸਮਾਨ ਲੱਛਣਾਂ ਦੇ ਆਧਾਰ 'ਤੇ `k ਕਲੱਸਟਰਾਂ` ਵਿੱਚ ਵੰਡਣ ਅਤੇ ਵਿਭਾਜਨ ਕਰਨ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ।\n", "\n", "ਕਲੱਸਟਰਾਂ ਨੂੰ [Voronoi ਡਾਇਗ੍ਰਾਮ](https://wikipedia.org/wiki/Voronoi_diagram) ਵਜੋਂ ਦਿਖਾਇਆ ਜਾ ਸਕਦਾ ਹੈ, ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਇੱਕ ਬਿੰਦੂ (ਜਾਂ 'ਬੀਜ') ਅਤੇ ਇਸ ਨਾਲ ਸੰਬੰਧਤ ਖੇਤਰ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ।\n", "\n", "
\n",
" \n",
"
\n",
" \n",
"
\n",
" \n",
"
\n",
" \n",
"