{ "nbformat": 4, "nbformat_minor": 0, "metadata": { "colab": { "name": "lesson_12-R.ipynb", "provenance": [], "collapsed_sections": [] }, "kernelspec": { "name": "ir", "display_name": "R" }, "language_info": { "name": "R" }, "coopTranslator": { "original_hash": "fab50046ca413a38939d579f8432274f", "translation_date": "2025-09-04T08:37:25+00:00", "source_file": "4-Classification/3-Classifiers-2/solution/R/lesson_12-R.ipynb", "language_code": "el" } }, "cells": [ { "cell_type": "markdown", "metadata": { "id": "jsFutf_ygqSx" }, "source": [ "# Δημιουργήστε ένα μοντέλο ταξινόμησης: Νόστιμες Ασιατικές και Ινδικές Κουζίνες\n" ] }, { "cell_type": "markdown", "metadata": { "id": "HD54bEefgtNO" }, "source": [ "## Ταξινομητές κουζίνας 2\n", "\n", "Σε αυτό το δεύτερο μάθημα ταξινόμησης, θα εξερευνήσουμε `περισσότερους τρόπους` για να ταξινομήσουμε κατηγορικά δεδομένα. Θα μάθουμε επίσης τις συνέπειες της επιλογής ενός ταξινομητή αντί για έναν άλλο.\n", "\n", "### [**Κουίζ πριν το μάθημα**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/23/)\n", "\n", "### **Προαπαιτούμενα**\n", "\n", "Υποθέτουμε ότι έχετε ολοκληρώσει τα προηγούμενα μαθήματα, καθώς θα συνεχίσουμε με ορισμένες έννοιες που μάθαμε προηγουμένως.\n", "\n", "Για αυτό το μάθημα, θα χρειαστούμε τα εξής πακέτα:\n", "\n", "- `tidyverse`: Το [tidyverse](https://www.tidyverse.org/) είναι μια [συλλογή πακέτων R](https://www.tidyverse.org/packages) σχεδιασμένη για να κάνει την επιστήμη δεδομένων πιο γρήγορη, εύκολη και διασκεδαστική!\n", "\n", "- `tidymodels`: Το [tidymodels](https://www.tidymodels.org/) είναι ένα [πλαίσιο συλλογής πακέτων](https://www.tidymodels.org/packages/) για μοντελοποίηση και μηχανική μάθηση.\n", "\n", "- `themis`: Το [πακέτο themis](https://themis.tidymodels.org/) παρέχει επιπλέον βήματα συνταγών για την αντιμετώπιση μη ισορροπημένων δεδομένων.\n", "\n", "Μπορείτε να τα εγκαταστήσετε ως εξής:\n", "\n", "`install.packages(c(\"tidyverse\", \"tidymodels\", \"kernlab\", \"themis\", \"ranger\", \"xgboost\", \"kknn\"))`\n", "\n", "Εναλλακτικά, το παρακάτω script ελέγχει αν έχετε τα απαραίτητα πακέτα για την ολοκλήρωση αυτής της ενότητας και τα εγκαθιστά για εσάς σε περίπτωση που λείπουν.\n" ] }, { "cell_type": "code", "metadata": { "id": "vZ57IuUxgyQt" }, "source": [ "suppressWarnings(if (!require(\"pacman\"))install.packages(\"pacman\"))\n", "\n", "pacman::p_load(tidyverse, tidymodels, themis, kernlab, ranger, xgboost, kknn)" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "z22M-pj4g07x" }, "source": [ "## **1. Ένας χάρτης ταξινόμησης**\n", "\n", "Στο [προηγούμενο μάθημα](https://github.com/microsoft/ML-For-Beginners/tree/main/4-Classification/2-Classifiers-1), προσπαθήσαμε να απαντήσουμε στο ερώτημα: πώς επιλέγουμε ανάμεσα σε πολλαπλά μοντέλα; Σε μεγάλο βαθμό, αυτό εξαρτάται από τα χαρακτηριστικά των δεδομένων και τον τύπο του προβλήματος που θέλουμε να λύσουμε (για παράδειγμα ταξινόμηση ή παλινδρόμηση).\n", "\n", "Προηγουμένως, μάθαμε για τις διάφορες επιλογές που έχετε όταν ταξινομείτε δεδομένα χρησιμοποιώντας το cheat sheet της Microsoft. Το πλαίσιο Μηχανικής Μάθησης της Python, Scikit-learn, προσφέρει ένα παρόμοιο αλλά πιο λεπτομερές cheat sheet που μπορεί να σας βοηθήσει περαιτέρω να περιορίσετε τους εκτιμητές σας (ένας άλλος όρος για τους ταξινομητές):\n", "\n", "
\n",
" \n",
"
\n",
" \n",
"
\n",
" \n",
"