{ "nbformat": 4, "nbformat_minor": 0, "metadata": { "colab": { "name": "lesson_12-R.ipynb", "provenance": [], "collapsed_sections": [] }, "kernelspec": { "name": "ir", "display_name": "R" }, "language_info": { "name": "R" }, "coopTranslator": { "original_hash": "fab50046ca413a38939d579f8432274f", "translation_date": "2025-09-04T02:39:47+00:00", "source_file": "4-Classification/3-Classifiers-2/solution/R/lesson_12-R.ipynb", "language_code": "hi" } }, "cells": [ { "cell_type": "markdown", "metadata": { "id": "jsFutf_ygqSx" }, "source": [] }, { "cell_type": "markdown", "metadata": { "id": "HD54bEefgtNO" }, "source": [ "## व्यंजन वर्गीकरणकर्ता 2\n", "\n", "इस दूसरे वर्गीकरण पाठ में, हम श्रेणीबद्ध डेटा को वर्गीकृत करने के `अधिक तरीकों` का पता लगाएंगे। हम यह भी जानेंगे कि एक वर्गीकरणकर्ता को दूसरे के ऊपर चुनने के क्या परिणाम हो सकते हैं।\n", "\n", "### [**पाठ से पहले का क्विज़**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/23/)\n", "\n", "### **पूर्वापेक्षा**\n", "\n", "हम मानते हैं कि आपने पिछले पाठ पूरे कर लिए हैं क्योंकि हम पहले सीखे गए कुछ अवधारणाओं को आगे बढ़ाएंगे।\n", "\n", "इस पाठ के लिए, हमें निम्नलिखित पैकेजों की आवश्यकता होगी:\n", "\n", "- `tidyverse`: [tidyverse](https://www.tidyverse.org/) एक [R पैकेजों का संग्रह](https://www.tidyverse.org/packages) है, जिसे डेटा विज्ञान को तेज़, आसान और अधिक मज़ेदार बनाने के लिए डिज़ाइन किया गया है!\n", "\n", "- `tidymodels`: [tidymodels](https://www.tidymodels.org/) फ्रेमवर्क मॉडलिंग और मशीन लर्निंग के लिए [पैकेजों का संग्रह](https://www.tidymodels.org/packages/) है।\n", "\n", "- `themis`: [themis पैकेज](https://themis.tidymodels.org/) असंतुलित डेटा से निपटने के लिए अतिरिक्त रेसिपी स्टेप्स प्रदान करता है।\n", "\n", "आप इन्हें इस प्रकार इंस्टॉल कर सकते हैं:\n", "\n", "`install.packages(c(\"tidyverse\", \"tidymodels\", \"kernlab\", \"themis\", \"ranger\", \"xgboost\", \"kknn\"))`\n", "\n", "वैकल्पिक रूप से, नीचे दिया गया स्क्रिप्ट यह जांचता है कि क्या आपके पास इस मॉड्यूल को पूरा करने के लिए आवश्यक पैकेज हैं और यदि वे गायब हैं तो उन्हें आपके लिए इंस्टॉल करता है।\n" ] }, { "cell_type": "code", "metadata": { "id": "vZ57IuUxgyQt" }, "source": [ "suppressWarnings(if (!require(\"pacman\"))install.packages(\"pacman\"))\n", "\n", "pacman::p_load(tidyverse, tidymodels, themis, kernlab, ranger, xgboost, kknn)" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "z22M-pj4g07x" }, "source": [ "## **1. एक वर्गीकरण मानचित्र**\n", "\n", "हमारे [पिछले पाठ](https://github.com/microsoft/ML-For-Beginners/tree/main/4-Classification/2-Classifiers-1) में, हमने इस सवाल का जवाब देने की कोशिश की: हम कई मॉडलों में से कैसे चुनें? काफी हद तक, यह डेटा की विशेषताओं और उस समस्या के प्रकार पर निर्भर करता है जिसे हम हल करना चाहते हैं (जैसे कि वर्गीकरण या प्रतिगमन?)\n", "\n", "पहले, हमने माइक्रोसॉफ्ट के चीट शीट का उपयोग करके डेटा को वर्गीकृत करने के विभिन्न विकल्पों के बारे में सीखा। पायथन के मशीन लर्निंग फ्रेमवर्क, Scikit-learn, एक समान लेकिन अधिक विस्तृत चीट शीट प्रदान करता है, जो आपके अनुमानों (classifiers का एक और नाम) को और अधिक सीमित करने में मदद कर सकता है:\n", "\n", "
\n",
" \n",
"
\n",
" \n",
"
\n",
" \n",
"