{ "nbformat": 4, "nbformat_minor": 0, "metadata": { "colab": { "name": "lesson_12-R.ipynb", "provenance": [], "collapsed_sections": [] }, "kernelspec": { "name": "ir", "display_name": "R" }, "language_info": { "name": "R" }, "coopTranslator": { "original_hash": "fab50046ca413a38939d579f8432274f", "translation_date": "2025-09-03T20:28:54+00:00", "source_file": "4-Classification/3-Classifiers-2/solution/R/lesson_12-R.ipynb", "language_code": "lt" } }, "cells": [ { "cell_type": "markdown", "metadata": { "id": "jsFutf_ygqSx" }, "source": [ "# Sukurkite klasifikavimo modelį: Skanūs Azijos ir Indijos patiekalai\n" ] }, { "cell_type": "markdown", "metadata": { "id": "HD54bEefgtNO" }, "source": [ "## Virtuvės klasifikatoriai 2\n", "\n", "Šioje antroje klasifikavimo pamokoje nagrinėsime `daugiau būdų` klasifikuoti kategorinius duomenis. Taip pat sužinosime apie pasekmes, susijusias su vieno klasifikatoriaus pasirinkimu vietoj kito.\n", "\n", "### [**Išankstinis testas**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/23/)\n", "\n", "### **Būtinos žinios**\n", "\n", "Darome prielaidą, kad jau baigėte ankstesnes pamokas, nes naudosime kai kurias anksčiau išmoktas sąvokas.\n", "\n", "Šiai pamokai reikės šių paketų:\n", "\n", "- `tidyverse`: [tidyverse](https://www.tidyverse.org/) yra [R paketų rinkinys](https://www.tidyverse.org/packages), sukurtas tam, kad duomenų mokslas būtų greitesnis, paprastesnis ir įdomesnis!\n", "\n", "- `tidymodels`: [tidymodels](https://www.tidymodels.org/) sistema yra [paketų rinkinys](https://www.tidymodels.org/packages/) modeliavimui ir mašininio mokymosi užduotims.\n", "\n", "- `themis`: [themis paketas](https://themis.tidymodels.org/) siūlo papildomus receptų žingsnius, skirtus spręsti nesubalansuotų duomenų problemas.\n", "\n", "Galite juos įdiegti naudodami šią komandą:\n", "\n", "`install.packages(c(\"tidyverse\", \"tidymodels\", \"kernlab\", \"themis\", \"ranger\", \"xgboost\", \"kknn\"))`\n", "\n", "Arba galite naudoti žemiau pateiktą scenarijų, kuris patikrina, ar turite reikalingus paketus šiam moduliui užbaigti, ir, jei jų trūksta, įdiegia juos už jus.\n" ] }, { "cell_type": "code", "metadata": { "id": "vZ57IuUxgyQt" }, "source": [ "suppressWarnings(if (!require(\"pacman\"))install.packages(\"pacman\"))\n", "\n", "pacman::p_load(tidyverse, tidymodels, themis, kernlab, ranger, xgboost, kknn)" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "z22M-pj4g07x" }, "source": [ "## **1. Klasifikacijos žemėlapis**\n", "\n", "Mūsų [ankstesnėje pamokoje](https://github.com/microsoft/ML-For-Beginners/tree/main/4-Classification/2-Classifiers-1) bandėme atsakyti į klausimą: kaip pasirinkti tarp kelių modelių? Didžiąja dalimi tai priklauso nuo duomenų savybių ir problemos tipo, kurią norime išspręsti (pavyzdžiui, klasifikacija ar regresija?).\n", "\n", "Anksčiau sužinojome apie įvairias galimybes, kurias turite klasifikuodami duomenis, naudodami „Microsoft“ parengtą atmintinę. Python mašininio mokymosi sistema, Scikit-learn, siūlo panašią, bet detalesnę atmintinę, kuri gali dar labiau padėti susiaurinti jūsų pasirinkimą tarp vertintojų (kitas terminas klasifikatoriams):\n", "\n", "
\n",
" \n",
"
\n",
" \n",
"
\n",
" \n",
"