{ "nbformat": 4, "nbformat_minor": 0, "metadata": { "colab": { "name": "lesson_12-R.ipynb", "provenance": [], "collapsed_sections": [] }, "kernelspec": { "name": "ir", "display_name": "R" }, "language_info": { "name": "R" }, "coopTranslator": { "original_hash": "fab50046ca413a38939d579f8432274f", "translation_date": "2025-10-11T12:33:49+00:00", "source_file": "4-Classification/3-Classifiers-2/solution/R/lesson_12-R.ipynb", "language_code": "ta" } }, "cells": [ { "cell_type": "markdown", "metadata": { "id": "jsFutf_ygqSx" }, "source": [ "# சுவையான ஆசிய மற்றும் இந்திய உணவுகளுக்கான வகைப்படுத்தல் மாடலை உருவாக்குங்கள்\n" ] }, { "cell_type": "markdown", "metadata": { "id": "HD54bEefgtNO" }, "source": [ "## உணவுப் வகை வகைப்படுத்திகள் 2\n", "\n", "இந்த இரண்டாவது வகைப்படுத்தல் பாடத்தில், `கட்டமைப்பான தரவுகளை` வகைப்படுத்துவதற்கான மேலும் பல வழிகளை ஆராய்வோம். மேலும், ஒரு வகைப்படுத்தியை மற்றொன்றுக்கு மேல் தேர்ந்தெடுப்பதற்கான விளைவுகளைப் பற்றி அறிந்துகொள்வோம்.\n", "\n", "### [**பாடத்துக்கு முன் வினாடி வினா**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/23/)\n", "\n", "### **முன் அறிவு**\n", "\n", "நீங்கள் முந்தைய பாடங்களை முடித்திருக்கிறீர்கள் என்று நாங்கள் கருதுகிறோம், ஏனெனில் நாம் முன்பு கற்றுக்கொண்ட சில கருத்துகளை தொடர்வோம்.\n", "\n", "இந்த பாடத்திற்காக, கீழ்க்கண்ட தொகுப்புகள் தேவைப்படும்:\n", "\n", "- `tidyverse`: [tidyverse](https://www.tidyverse.org/) என்பது தரவியல் அறிவியலை வேகமாக, எளிதாக மற்றும் மகிழ்ச்சியாக மாற்றுவதற்காக வடிவமைக்கப்பட்ட [R தொகுப்புகளின் தொகுப்பு](https://www.tidyverse.org/packages) ஆகும்!\n", "\n", "- `tidymodels`: [tidymodels](https://www.tidymodels.org/) கட்டமைப்பு என்பது மாதிரிகள் மற்றும் இயந்திர கற்றலுக்கான [தொகுப்புகளின் தொகுப்பு](https://www.tidymodels.org/packages/) ஆகும்.\n", "\n", "- `themis`: [themis தொகுப்பு](https://themis.tidymodels.org/) சமநிலையற்ற தரவுகளை கையாளுவதற்கான கூடுதல் செய்முறைகளை வழங்குகிறது.\n", "\n", "இந்த தொகுப்புகளை நீங்கள் கீழ்க்கண்டவாறு நிறுவலாம்:\n", "\n", "`install.packages(c(\"tidyverse\", \"tidymodels\", \"kernlab\", \"themis\", \"ranger\", \"xgboost\", \"kknn\"))`\n", "\n", "மாற்றாக, கீழே உள்ள ஸ்கிரிப்ட் இந்த தொகுப்புகள் இந்த மொடியூலை முடிக்க தேவையானவை என்பதைச் சரிபார்க்கிறது, அவற்றில் ஏதேனும் இல்லையெனில் அவற்றை உங்களுக்காக நிறுவுகிறது.\n" ] }, { "cell_type": "code", "metadata": { "id": "vZ57IuUxgyQt" }, "source": [ "suppressWarnings(if (!require(\"pacman\"))install.packages(\"pacman\"))\n", "\n", "pacman::p_load(tidyverse, tidymodels, themis, kernlab, ranger, xgboost, kknn)" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "z22M-pj4g07x" }, "source": [ "இப்போது, செயல்படத் தொடங்குவோம்!\n", "\n", "## **1. வகைப்பாட்டு வரைபடம்**\n", "\n", "எங்கள் [முந்தைய பாடத்தில்](https://github.com/microsoft/ML-For-Beginners/tree/main/4-Classification/2-Classifiers-1), இந்த கேள்வியைத் தீர்க்க முயன்றோம்: பல மாதிரிகளுக்கு இடையில் எவ்வாறு தேர்வு செய்வது? பெரும்பாலும், இது தரவின் பண்புகள் மற்றும் நாம் தீர்க்க விரும்பும் பிரச்சினையின் வகை (உதாரணமாக வகைப்பாடு அல்லது மடங்கல்) ஆகியவற்றின் மீது निर्भर.\n", "\n", "முந்தையதாக, தரவுகளை வகைப்படுத்த Microsoft-இன் சிட் ஷீட்டை பயன்படுத்துவதற்கான பல்வேறு விருப்பங்களைப் பற்றி நாம் கற்றுக்கொண்டோம். Python-இன் இயந்திரக் கற்றல் கட்டமைப்பு, Scikit-learn, இதே போன்ற ஆனால் மேலும் விரிவான சிட் ஷீட்டை வழங்குகிறது, இது உங்கள் எஸ்டிமேட்டர்களை (வகைப்பாட்டாளர்களுக்கான மற்றொரு சொல்) மேலும் குறைக்க உதவுகிறது:\n", "\n", "
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"