{ "nbformat": 4, "nbformat_minor": 0, "metadata": { "colab": { "name": "lesson_12-R.ipynb", "provenance": [], "collapsed_sections": [] }, "kernelspec": { "name": "ir", "display_name": "R" }, "language_info": { "name": "R" }, "coopTranslator": { "original_hash": "fab50046ca413a38939d579f8432274f", "translation_date": "2025-08-29T23:49:57+00:00", "source_file": "4-Classification/3-Classifiers-2/solution/R/lesson_12-R.ipynb", "language_code": "ru" } }, "cells": [ { "cell_type": "markdown", "metadata": { "id": "jsFutf_ygqSx" }, "source": [ "# Построить модель классификации: Вкусные азиатские и индийские кухни\n" ] }, { "cell_type": "markdown", "metadata": { "id": "HD54bEefgtNO" }, "source": [ "## Классификаторы кухни 2\n", "\n", "Во втором уроке по классификации мы изучим `дополнительные способы` классификации категориальных данных. Также мы разберем последствия выбора одного классификатора вместо другого.\n", "\n", "### [**Квиз перед лекцией**](https://gray-sand-07a10f403.1.azurestaticapps.net/quiz/23/)\n", "\n", "### **Предварительные знания**\n", "\n", "Мы предполагаем, что вы завершили предыдущие уроки, так как будем использовать некоторые концепции, изученные ранее.\n", "\n", "Для этого урока нам понадобятся следующие пакеты:\n", "\n", "- `tidyverse`: [tidyverse](https://www.tidyverse.org/) — это [коллекция пакетов для R](https://www.tidyverse.org/packages), разработанная для того, чтобы сделать работу с данными быстрее, проще и интереснее!\n", "\n", "- `tidymodels`: [tidymodels](https://www.tidymodels.org/) — это [фреймворк](https://www.tidymodels.org/packages/), представляющий собой коллекцию пакетов для моделирования и машинного обучения.\n", "\n", "- `themis`: [пакет themis](https://themis.tidymodels.org/) предоставляет дополнительные шаги для работы с несбалансированными данными.\n", "\n", "Вы можете установить их следующим образом:\n", "\n", "`install.packages(c(\"tidyverse\", \"tidymodels\", \"kernlab\", \"themis\", \"ranger\", \"xgboost\", \"kknn\"))`\n", "\n", "Кроме того, приведенный ниже скрипт проверяет, установлены ли у вас необходимые пакеты для выполнения этого модуля, и устанавливает их, если они отсутствуют.\n" ] }, { "cell_type": "code", "metadata": { "id": "vZ57IuUxgyQt" }, "source": [ "suppressWarnings(if (!require(\"pacman\"))install.packages(\"pacman\"))\n", "\n", "pacman::p_load(tidyverse, tidymodels, themis, kernlab, ranger, xgboost, kknn)" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "z22M-pj4g07x" }, "source": [ "## **1. Карта классификации**\n", "\n", "В нашем [предыдущем уроке](https://github.com/microsoft/ML-For-Beginners/tree/main/4-Classification/2-Classifiers-1) мы пытались ответить на вопрос: как выбрать между несколькими моделями? Во многом это зависит от характеристик данных и типа задачи, которую мы хотим решить (например, классификация или регрессия).\n", "\n", "Ранее мы узнали о различных вариантах классификации данных, используя шпаргалку от Microsoft. Фреймворк машинного обучения Python, Scikit-learn, предлагает похожую, но более детализированную шпаргалку, которая может помочь сузить выбор оценщиков (другое название классификаторов):\n", "\n", "
\n",
" \n",
"
\n",
" \n",
"
\n",
" \n",
"