{ "nbformat": 4, "nbformat_minor": 0, "metadata": { "colab": { "name": "lesson_12-R.ipynb", "provenance": [], "collapsed_sections": [] }, "kernelspec": { "name": "ir", "display_name": "R" }, "language_info": { "name": "R" }, "coopTranslator": { "original_hash": "fab50046ca413a38939d579f8432274f", "translation_date": "2025-09-03T20:29:53+00:00", "source_file": "4-Classification/3-Classifiers-2/solution/R/lesson_12-R.ipynb", "language_code": "pl" } }, "cells": [ { "cell_type": "markdown", "metadata": { "id": "jsFutf_ygqSx" }, "source": [ "# Zbuduj model klasyfikacji: Pyszne azjatyckie i indyjskie kuchnie\n" ] }, { "cell_type": "markdown", "metadata": { "id": "HD54bEefgtNO" }, "source": [ "## Klasyfikatory kuchni 2\n", "\n", "W tej drugiej lekcji dotyczącej klasyfikacji, zbadamy `więcej sposobów` klasyfikowania danych kategorycznych. Dowiemy się również, jakie konsekwencje niesie za sobą wybór jednego klasyfikatora zamiast innego.\n", "\n", "### [**Quiz przed wykładem**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/23/)\n", "\n", "### **Wymagania wstępne**\n", "\n", "Zakładamy, że ukończyłeś poprzednie lekcje, ponieważ będziemy kontynuować niektóre wcześniej omówione pojęcia.\n", "\n", "Do tej lekcji będziemy potrzebować następujących pakietów:\n", "\n", "- `tidyverse`: [tidyverse](https://www.tidyverse.org/) to [zbiór pakietów R](https://www.tidyverse.org/packages) zaprojektowany, aby uczynić analizę danych szybszą, łatwiejszą i bardziej przyjemną!\n", "\n", "- `tidymodels`: [tidymodels](https://www.tidymodels.org/) to [framework](https://www.tidymodels.org/packages/) składający się z pakietów do modelowania i uczenia maszynowego.\n", "\n", "- `themis`: [pakiet themis](https://themis.tidymodels.org/) dostarcza dodatkowe kroki w przepisach do radzenia sobie z niezrównoważonymi danymi.\n", "\n", "Możesz je zainstalować za pomocą:\n", "\n", "`install.packages(c(\"tidyverse\", \"tidymodels\", \"kernlab\", \"themis\", \"ranger\", \"xgboost\", \"kknn\"))`\n", "\n", "Alternatywnie, poniższy skrypt sprawdza, czy masz wymagane pakiety do ukończenia tego modułu i instaluje je, jeśli ich brakuje.\n" ] }, { "cell_type": "code", "metadata": { "id": "vZ57IuUxgyQt" }, "source": [ "suppressWarnings(if (!require(\"pacman\"))install.packages(\"pacman\"))\n", "\n", "pacman::p_load(tidyverse, tidymodels, themis, kernlab, ranger, xgboost, kknn)" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "z22M-pj4g07x" }, "source": [ "## **1. Mapa klasyfikacji**\n", "\n", "W naszej [poprzedniej lekcji](https://github.com/microsoft/ML-For-Beginners/tree/main/4-Classification/2-Classifiers-1) próbowaliśmy odpowiedzieć na pytanie: jak wybrać pomiędzy wieloma modelami? W dużej mierze zależy to od charakterystyki danych oraz rodzaju problemu, który chcemy rozwiązać (na przykład klasyfikacja czy regresja?).\n", "\n", "Wcześniej dowiedzieliśmy się o różnych opcjach klasyfikacji danych, korzystając z arkusza pomocy Microsoftu. Framework Machine Learning w Pythonie, Scikit-learn, oferuje podobny, ale bardziej szczegółowy arkusz pomocy, który może dodatkowo pomóc w zawężeniu wyboru estymatorów (inaczej klasyfikatorów):\n", "\n", "
\n",
" \n",
"
\n",
" \n",
"
\n",
" \n",
"