From 53f59247afa7f01cfb79ee08639d46a01392fcd2 Mon Sep 17 00:00:00 2001 From: "localizeflow[bot]" Date: Mon, 20 Apr 2026 20:42:58 +0000 Subject: [PATCH] chore(i18n): sync translations with latest source changes (chunk 1/1, 12 changes) --- translations/bg/.co-op-translator.json | 12 +- .../bg/2-Regression/3-Linear/README.md | 244 ++++++++--------- .../2-Classifiers-1/README.md | 133 ++++----- translations/bg/README.md | 204 +++++++------- translations/ro/.co-op-translator.json | 12 +- .../ro/2-Regression/3-Linear/README.md | 256 +++++++++--------- .../2-Classifiers-1/README.md | 148 +++++----- translations/ro/README.md | 205 +++++++------- translations/sk/.co-op-translator.json | 12 +- .../sk/2-Regression/3-Linear/README.md | 222 +++++++-------- .../2-Classifiers-1/README.md | 166 ++++++------ translations/sk/README.md | 236 ++++++++-------- 12 files changed, 947 insertions(+), 903 deletions(-) diff --git a/translations/bg/.co-op-translator.json b/translations/bg/.co-op-translator.json index 37db80409..9a0093ad8 100644 --- a/translations/bg/.co-op-translator.json +++ b/translations/bg/.co-op-translator.json @@ -90,8 +90,8 @@ "language_code": "bg" }, "2-Regression/3-Linear/README.md": { - "original_hash": "9a8359f1945bd3beccccb2b46592580e", - "translation_date": "2026-02-28T10:26:28+00:00", + "original_hash": "26c53a922f1f1e8542b0ea41ff52221a", + "translation_date": "2026-04-20T20:41:43+00:00", "source_file": "2-Regression/3-Linear/README.md", "language_code": "bg" }, @@ -168,8 +168,8 @@ "language_code": "bg" }, "4-Classification/2-Classifiers-1/README.md": { - "original_hash": "1a6e9e46b34a2e559fbbfc1f95397c7b", - "translation_date": "2025-09-05T00:41:49+00:00", + "original_hash": "cb761595e5b6c42b99bb81bd13683311", + "translation_date": "2026-04-20T20:42:47+00:00", "source_file": "4-Classification/2-Classifiers-1/README.md", "language_code": "bg" }, @@ -552,8 +552,8 @@ "language_code": "bg" }, "README.md": { - "original_hash": "7fb48097f57e680b380cd9aae988d317", - "translation_date": "2026-04-06T17:22:15+00:00", + "original_hash": "3e3a6c7e68e0afe7e2276ac046e4d7a0", + "translation_date": "2026-04-20T20:39:56+00:00", "source_file": "README.md", "language_code": "bg" }, diff --git a/translations/bg/2-Regression/3-Linear/README.md b/translations/bg/2-Regression/3-Linear/README.md index 20246a8c8..92c895f52 100644 --- a/translations/bg/2-Regression/3-Linear/README.md +++ b/translations/bg/2-Regression/3-Linear/README.md @@ -1,127 +1,126 @@ -# Създаване на регресионен модел с помощта на Scikit-learn: регресия по четири начина +# Изграждане на регресионен модел с помощта на Scikit-learn: регресия по четири начина ## Забележка за начинаещи -Линейната регресия се използва, когато искаме да предвидим **числова стойност** (например, цена на къща, температура или продажби). Тя работи, като намира права линия, която най-добре представя връзката между входните характеристики и изходния резултат. +Линейната регресия се използва, когато искаме да предскажем **числена стойност** (например цена на къща, температура или продажби). Тя работи чрез намиране на права линия, която най-добре представя връзката между входните характеристики и изхода. -В този урок се съсредоточаваме върху разбирането на концепцията, преди да разгледаме по-напреднали техники за регресия. +В този урок се фокусираме върху разбирането на концепцията, преди да разгледаме по-сложни регресионни техники. ![Линейна срещу полиномиална регресия инфографика](../../../../translated_images/bg/linear-polynomial.5523c7cb6576ccab.webp) > Инфографика от [Dasani Madipalli](https://twitter.com/dasani_decoded) -## [Предварителен тест преди лекцията](https://ff-quizzes.netlify.app/en/ml/) +## [Предварителен тест](https://ff-quizzes.netlify.app/en/ml/) > ### [Този урок е наличен и на R!](../../../../2-Regression/3-Linear/solution/R/lesson_3.html) -### Въведение +### Въведение -Досега разгледахте какво е регресия със примерни данни, събрани от набора с данни за цените на тиквите, който ще използваме през целия урок. Също така сте ги визуализирали с Matplotlib. +Досега разгледахте какво е регресия чрез примерни данни от набора с цени на тикви, който ще използваме през целия урок. Също така го визуализирахте с помощта на Matplotlib. -Сега сте готови да навлезете по-дълбоко в регресията за машинното обучение. Докато визуализацията ви помага да разберете данните, истинската сила на машинното обучение идва от _обучението на модели_. Моделите се обучават на исторически данни, за да улавят автоматично зависимости в данните, и ви позволяват да предскажете резултати за нови данни, които моделът не е виждал преди. +Сега сте готови да навлезете по-дълбоко в регресията за ML. Докато визуализацията ви позволява да разберете данните, истинската сила на Машинното обучение идва от _обучението на модели_. Моделите се обучават върху исторически данни, за да уловят автоматично зависимостите в данните, и ви позволяват да предсказвате резултати за нови данни, които моделът не е виждал досега. -В този урок ще научите повече за два вида регресия: _базова линейна регресия_ и _полиномиална регресия_, заедно с част от математиката зад тези техники. Тези модели ще ни позволят да предскажем цените на тиквите в зависимост от различни входни данни. +В този урок ще научите повече за два вида регресия: _основна линейна регресия_ и _полиномиална регресия_, заедно с част от математиката зад тези техники. Тези модели ще ни позволят да предсказваме цените на тиквите в зависимост от различни входни данни. -[![Машинно обучение за начинаещи - Разбиране на линейната регресия](https://img.youtube.com/vi/CRxFT8oTDMg/0.jpg)](https://youtu.be/CRxFT8oTDMg "Машинно обучение за начинаещи - Разбиране на линейната регресия") +[![ML за начинаещи - Разбиране на линейната регресия](https://img.youtube.com/vi/CRxFT8oTDMg/0.jpg)](https://youtu.be/CRxFT8oTDMg "ML за начинаещи - Разбиране на линейната регресия") -> 🎥 Натиснете върху изображението по-горе за кратко видео с обзор на линейната регресия. +> 🎥 Кликнете върху изображението по-горе за кратко видео с обобщение на линейната регресия. -> През тази учебна програма предполагаме минимални знания по математика и целим да я направим достъпна за студенти от други области, затова следете за бележки, 🧮 акценти, диаграми и други инструменти за учене, които помагат за по-доброто разбиране. +> В целия този учебен план предполагаме минимални знания по математика и се стремим да го направим достъпен за студенти от други области, затова внимавайте за бележки, 🧮 извадки, схеми и други учебни средства, които подпомагат разбирането. -### Предварителни изисквания +### Предварителни умения -Вече трябва да сте запознати със структурата на тиквените данни, които разглеждаме. Можете да ги намерите предварително заредени и почистени във файла _notebook.ipynb_ към този урок. Във файла цената на тиквата е показана за бушел в нов DataFrame. Уверете се, че можете да стартирате тези ноутбуци в среди като Visual Studio Code. +До момента трябва да сте запознати със структурата на данните за тиквите, които разглеждаме. Можете да ги намерите предварително заредени и почистени във файла _notebook.ipynb_ за този урок. Във файла цената на тиквите се показва на бушел в нов DataFrame. Уверете се, че можете да стартирате тези тетрадки (notebooks) в ядра (kernels) в Visual Studio Code. ### Подготовка -Като напомняне, вие зареждате тези данни, за да можете да им задавате въпроси. - -- Кога е най-доброто време да купувам тикви? -- Каква цена мога да очаквам за кашон с миниатюрни тикви? -- Трябва ли да ги купувам в кошници от половин бушел или в кутия от 1 1/9 бушел? +Като напомняне, зареждате тези данни, за да можете да задавате въпроси спрямо тях. +- Кога е най-доброто време да се купуват тикви? +- Каква цена мога да очаквам за кутия с мини тикви? +- Трябва ли да ги купувам в кошници по половин бушел или в кутии по 1 1/9 бушел? Нека продължим да изследваме тези данни. -В предишния урок създадохте Pandas DataFrame и го напълнихте с част от оригиналния набор от данни, стандартизирайки цените по бушел. По този начин обаче събрахте около 400 точки данни и само за есенните месеци. +В предишния урок създадохте Pandas DataFrame и го запълнихте с част от оригиналния набор от данни, стандартизирайки цените на бушел. По този начин обаче събрахте само около 400 точки данни и то само за есенните месеци. -Вижте предварително заредените данни в ноутбука, предоставен към този урок. Данните са заредени, а първоначален диаграма на разсейване показва месечна информация. Може би можем да получим малко повече детайли за естеството на данните, като ги почистим още. +Вижте данните, които предварително заредихме в съпровождащата тетрадка за този урок. Данните са предварително заредени и е начертан първоначален разсейващ (scatter) график за данните по месеци. Може би можем да добавим малко повече детайли за естеството на данните чрез по-добро почистване. -## Линия на линейна регресия +## Линия на линейната регресия -Както научихте в Урок 1, целта на упражнението по линейна регресия е да може да начертаете линия, която да: +Както научихте в Урок 1, целта на упражнение по линейна регресия е да можете да начертаете линия, която да: -- **Показва връзката между променливите**. Показва връзката между променливите -- **Прави прогнози**. Прави точни прогнози къде би попаднала нова точка в отношение към тази линия. +- **Показва взаимовръзки между променливи**. Показва връзката между променливите +- **Прави прогнози**. Прави точни прогнози за това къде нова точка данни би попаднала в съотношение с линията. -Типично за **регресия с минимални квадрати** е да се начертае такава линия. Терминът "Минимални квадрати" се отнася до процеса на минимизиране на общата грешка в нашия модел. За всяка точка измерваме вертикалното разстояние (наречено остатък) между реалната точка и нашата регресионна линия. +Точно такава линия обичайно се чертае с помощта на **регресия с минимални квадрати** (Least-Squares Regression). Терминът "минимални квадрати" се отнася до процеса на минимизиране на общата грешка в нашия модел. За всяка точка данни измерваме вертикалното разстояние (наречено остатък) между действителната точка и нашата регресионна линия. Тези разстояния се повдигат на квадрат по две основни причини: -1. **Магнитуда пред посока:** Искаме да третираме грешката -5 по същия начин както грешката +5. Квадратирането прави всички стойности положителни. +1. **Величина пред посока:** Искаме да третираме грешка -5 същo като грешка +5. Квaдратирането превръща всички стойности в положителни. -2. **Налагане на наказание за отклонения:** Квадратирането дава по-голяма тежест на по-големите грешки, карайки линията да стои по-близо до далечните точки. +2. **Накaзване на екстремни стойности:** Квaдратирането придава по-голяма тежест на по-големите грешки, принуждавайки линията да стои по-близо до точки, които са далеч. -След това събираме всички тези квадратирани стойности. Целта ни е да намерим конкретната линия, при която тази окончателна сума е най-малка (най-ниската възможна стойност) — откъдето идва името "Минимални квадрати". +След това събираме всички тези квадратирани стойности. Целта ни е да намерим конкретна линия, при която тази крайна сума е най-малка (най-малката възможна стойност) — откъдето идва и името "минимални квадрати". -> **🧮 Покажи ми математиката** -> -> Тази линия, наречена _линия на най-добро напасване_, може да бъде изразена чрез [уравнение](https://en.wikipedia.org/wiki/Simple_linear_regression): -> +> **🧮 Покажи ми математиката** +> +> Тази линия, наречена _линия на най-добро прилягане_, може да бъде изразена с [уравнение](https://en.wikipedia.org/wiki/Simple_linear_regression): +> > ``` > Y = a + bX > ``` > -> `X` е 'обяснителната променлива'. `Y` е 'зависимата променлива'. Наклонът на линията е `b`, а `a` е пресечната точка с оста Y, което се отнася до стойността на `Y` когато `X = 0`. +> `X` е 'обяснителна променлива'. `Y` е 'зависима променлива'. Наклонът на линията е `b`, а `a` е сечението по оста y, което означава стойността на `Y` когато `X = 0`. > >![изчисляване на наклона](../../../../translated_images/bg/slope.f3c9d5910ddbfcf9.webp) > -> Първо се изчислява наклонът `b`. Инфографика от [Jen Looper](https://twitter.com/jenlooper) +> Първо изчислете наклона `b`. Инфографика от [Jen Looper](https://twitter.com/jenlooper) > -> С други думи, и отнасяйки се към първоначалния въпрос в нашите тиквени данни: "предсказване на цената на тиква за бушел по месеци", `X` би се отнасяло до цената, а `Y` - до месеца на продажба. +> С други думи, и във връзка с първоначалния въпрос в нашите данни за тиквите: "предскажи цената на тиква на бушел по месеци", `X` ще се отнася до цената, а `Y` до месеца на продажбата. > >![завърши уравнението](../../../../translated_images/bg/calculation.a209813050a1ddb1.webp) > -> Изчислете стойността на Y. Ако плащате около $4, значи е април! Инфографика от [Jen Looper](https://twitter.com/jenlooper) +> Изчислете стойността на Y. Ако плащате около 4 долара, трябва да е април! Инфографика от [Jen Looper](https://twitter.com/jenlooper) > -> Математиката зад линията трябва да покаже наклона на линията, който зависи и от пресечната точка или къде се намира `Y`, когато `X = 0`. +> Математиката зад изчисляването на линията трябва да отрази наклона на линията, който също зависи от сечението, т.е. къде е `Y` когато `X = 0`. > -> Можете да наблюдавате метода за изчисление на тези стойности на уебсайта [Math is Fun](https://www.mathsisfun.com/data/least-squares-regression.html). Също посетете [този калкулатор за минимални квадрати](https://www.mathsisfun.com/data/least-squares-calculator.html), за да видите как стойностите на числата влияят на линията. +> Можете да видите начина на изчисление за тези стойности на уебсайта [Math is Fun](https://www.mathsisfun.com/data/least-squares-regression.html). Посетете също [този калкулатор за минимални квадрати](https://www.mathsisfun.com/data/least-squares-calculator.html), за да проследите как стойностите влияят на линията. ## Корелация -Още един термин, който трябва да разберете, е **коефициентът на корелация** между дадени променливи X и Y. С разсейваща диаграма бързо можете да визуализирате този коефициент. Графика с точки, подредени около права линия, има висока корелация, но графика с точки, разпръснати хаотично между X и Y, има ниска корелация. +Още един термин, който да разберете, е **коефициентът на корелация** между дадени променливи X и Y. Използвайки разсейващ (scatter) график, може бързо да визуализирате този коефициент. Графика с точки, подредени в чиста линия, показва висока корелация, докато графика с точки разпръснати навсякъде между X и Y показва ниска корелация. -Добър модел за линейна регресия ще бъде този, който има висок (близо до 1, а не до 0) коефициент на корелация, използвайки метода на минимални квадрати с регресионна линия. +Добър линейно регресионен модел е този, който има висок (по-близо до 1 отколкото до 0) коефициент на корелация при приложена метода на регресия с минимални квадрати с линия на регресия. -✅ Стартирайте ноутбука към този урок и разгледайте разсейващата диаграма за връзката Месец - Цена. Изглежда ли, че данните свързващи Месец с Цена за продажбата на тикви имат висока или ниска корелация според вашата визуална интерпретация на диаграмата? Променя ли се това, ако използвате по-фина мярка вместо `Month`, напр. *ден от годината* (т.е. брой дни от началото на годината)? +✅ Стартирайте тетрадката, придружаваща този урок, и разгледайте разсейващия график Месец към Цена. Изглежда ли асоциацията между Месец и Цена за продажбата на тикви с висока или ниска корелация според вашата визуална интерпретация на графиката? Променя ли се това, ако използвате по-фина мярка вместо `Месец`, напр. *ден от годината* (т.е. брой дни от началото на годината)? -В кода по-долу приемаме, че сме почистили данните и имаме DataFrame на име `new_pumpkins`, подобен на следния: +В следващия код ще приемем, че сме почистили данните и сме получили DataFrame, наречен `new_pumpkins`, подобен на следния: -ID | Month | DayOfYear | Variety | City | Package | Low Price | High Price | Price +ID | Месец | ДенОтГодината | Вид | Град | Опаковка | Минимална цена | Максимална цена | Цена ---|-------|-----------|---------|------|---------|-----------|------------|------- -70 | 9 | 267 | PIE TYPE | BALTIMORE | 1 1/9 bushel cartons | 15.0 | 15.0 | 13.636364 -71 | 9 | 267 | PIE TYPE | BALTIMORE | 1 1/9 bushel cartons | 18.0 | 18.0 | 16.363636 -72 | 10 | 274 | PIE TYPE | BALTIMORE | 1 1/9 bushel cartons | 18.0 | 18.0 | 16.363636 -73 | 10 | 274 | PIE TYPE | BALTIMORE | 1 1/9 bushel cartons | 17.0 | 17.0 | 15.454545 -74 | 10 | 281 | PIE TYPE | BALTIMORE | 1 1/9 bushel cartons | 15.0 | 15.0 | 13.636364 +70 | 9 | 267 | ПАЙ ТИП | БАЛТИМОР | 1 1/9 бушелови кутии | 15.0 | 15.0 | 13.636364 +71 | 9 | 267 | ПАЙ ТИП | БАЛТИМОР | 1 1/9 бушелови кутии | 18.0 | 18.0 | 16.363636 +72 | 10 | 274 | ПАЙ ТИП | БАЛТИМОР | 1 1/9 бушелови кутии | 18.0 | 18.0 | 16.363636 +73 | 10 | 274 | ПАЙ ТИП | БАЛТИМОР | 1 1/9 бушелови кутии | 17.0 | 17.0 | 15.454545 +74 | 10 | 281 | ПАЙ ТИП | БАЛТИМОР | 1 1/9 бушелови кутии | 15.0 | 15.0 | 13.636364 -> Кодът за почистване на данните е наличен в [`notebook.ipynb`](notebook.ipynb). Извършихме същите стъпки за почистване като в предишния урок и изчислихме колоната `DayOfYear` със следното изразяване: +> Кодът за почистване на данните е наличен във [`notebook.ipynb`](notebook.ipynb). Извършихме същите стъпки по почистване както в предишния урок и изчислихме колоната `DayOfYear` с помощта на следното изражение: ```python day_of_year = pd.to_datetime(pumpkins['Date']).apply(lambda dt: (dt-datetime(dt.year,1,1)).days) ``` -Сега, когато разбирате математиката зад линейната регресия, нека създадем регресионен модел, за да видим дали можем да предскажем коя опаковка тикви ще има най-добри цени. Някой, купуващ тикви за празничен тиквен участък, може да иска тази информация, за да оптимизира покупките си. +Сега, когато разбирате математиката зад линейната регресия, нека създадем регресионен модел, за да видим дали можем да предскажем коя опаковка тикви ще има най-добри цени. Някой, който купува тикви за празничен тиквен етикет, може да иска тази информация, за да оптимизира покупките на опаковки тикви за етикета. ## Търсене на корелация -[![Машинно обучение за начинаещи - Търсене на корелация: ключът към линейната регресия](https://img.youtube.com/vi/uoRq-lW2eQo/0.jpg)](https://youtu.be/uoRq-lW2eQo "Машинно обучение за начинаещи - Търсене на корелация: ключът към линейната регресия") +[![ML за начинаещи - Търсене на корелация: Ключът към линейната регресия](https://img.youtube.com/vi/uoRq-lW2eQo/0.jpg)](https://youtu.be/uoRq-lW2eQo "ML за начинаещи - Търсене на корелация: Ключът към линейната регресия") -> 🎥 Натиснете върху изображението по-горе за кратко видео с обзор на корелацията. +> 🎥 Кликнете върху изображението по-горе за кратко видео с обобщение на корелацията. -От предишния урок вероятно сте видели, че средната цена за различни месеци изглежда така: +От предишния урок вероятно сте видели, че средната цена за различните месеци изглежда така: Средна цена по месеци -Това предполага, че трябва да има някаква корелация и можем да се опитаме да обучим модел за линейна регресия, за да предскажем връзката между `Month` и `Price` или между `DayOfYear` и `Price`. Ето графика на разсейване, показваща последната връзка: +Това предполага, че трябва да има някаква корелация и можем да пробваме да обучим модел на линейна регресия за прогнозиране на връзката между `Месец` и `Цена`, или между `ДенОтГодината` и `Цена`. Ето разсейващия график, който показва последната връзка: -Графика на разсейване на Цена спрямо Ден от годината +Scatter plot Цена срещу Ден от година Нека проверим дали има корелация с функцията `corr`: @@ -130,7 +129,7 @@ print(new_pumpkins['Month'].corr(new_pumpkins['Price'])) print(new_pumpkins['DayOfYear'].corr(new_pumpkins['Price'])) ``` -Изглежда, че корелацията е доста малка, -0.15 през `Month` и -0.17 през `DayOfMonth`, но може да има друга важна връзка. Изглежда, че има различни клъстъри с цени, отговарящи на различни видове тикви. За да потвърдим тази хипотеза, нека начертаем всяка категория тикви с различен цвят. Като подаваме параметър `ax` на функцията `scatter`, можем да начертаем всички точки на една и съща графика: +Изглежда, че корелацията е доста малка, -0.15 за `Месец` и -0.17 за `ДенОтГодината`, но може да има друга важна връзка. Изглежда има различни клъстери от цени, съответстващи на различни сортове тикви. За да потвърдим тази хипотеза, нека начертаем всяка категория тикви с различен цвят. Предавайки параметър `ax` на функцията за разсейващ график, можем да начертаем всички точки на един и същ график: ```python ax=None @@ -140,42 +139,42 @@ for i,var in enumerate(new_pumpkins['Variety'].unique()): ax = df.plot.scatter('DayOfYear','Price',ax=ax,c=colors[i],label=var) ``` -Графика на разсейване на Цена спрямо Ден от годината цвят +Разсейващ график Цена срещу Ден от година, цветно -Нашето проучване предполага, че видът има по-голям ефект върху крайната цена, отколкото действителната дата на продажба. Можем да видим това с помощта на бар графика: +Нашето разследване подсказва, че видът има по-голямо влияние върху цената отколкото точната дата на продажба. Можем да го видим и на лентов график: ```python new_pumpkins.groupby('Variety')['Price'].mean().plot(kind='bar') ``` -Бар графика на цена спрямо вид +Бар графика на цена по вид -Нека се фокусираме за момента само върху един вид тиква, 'pie type', и видим каква е влиянието на датата върху цената: +Нека се фокусираме за момент само върху един сорт тикви - 'пай тип' и да видим каква е зависимостта на цената от датата: ```python pie_pumpkins = new_pumpkins[new_pumpkins['Variety']=='PIE TYPE'] pie_pumpkins.plot.scatter('DayOfYear','Price') ``` -Графика на разсейване на Цена спрямо Ден от годината +Разсейващ график Цена срещу Ден от година -Ако сега изчислим корелацията между `Price` и `DayOfYear` с функцията `corr`, ще получим нещо като `-0.27` - което означава, че обучението на предсказателен модел има смисъл. +Ако сега изчислим корелацията между `Цена` и `ДенОтГодината` чрез функцията `corr`, ще получим нещо като `-0.27` — което означава, че има смисъл да обучим предсказващ модел. -> Преди да обучите модел за линейна регресия, е важно да се уверите, че данните са чисти. Линейната регресия не работи добре с липсващи стойности, затова е разумно да се изчистят всички празни клетки: +> Преди да обучите модел на линейна регресия, е важно да сте сигурни, че данните са чисти. Линейната регресия не работи добре с липсващи стойности, затова е разумно да се отървем от всички празни клетки: ```python pie_pumpkins.dropna(inplace=True) pie_pumpkins.info() ``` -Друг подход би бил да замените липсващите стойности със средни стойности от съответната колона. +Друг подход би бил да запълним празните стойности със средните стойности от съответните колони. -## Простата линейна регресия +## Проста линейна регресия -[![Машинно обучение за начинаещи - Линейна и полиномиална регресия с Scikit-learn](https://img.youtube.com/vi/e4c_UP2fSjg/0.jpg)](https://youtu.be/e4c_UP2fSjg "Машинно обучение за начинаещи - Линейна и полиномиална регресия с Scikit-learn") +[![ML за начинаещи - Линейна и полиномиална регресия с Scikit-learn](https://img.youtube.com/vi/e4c_UP2fSjg/0.jpg)](https://youtu.be/e4c_UP2fSjg "ML за начинаещи - Линейна и полиномиална регресия с Scikit-learn") -> 🎥 Натиснете върху изображението по-горе за кратко видео с обзор на линейната и полиномиалната регресия. +> 🎥 Кликнете върху изображението по-горе за кратко видео с обобщение на линейната и полиномиалната регресия. -За да обучим нашия модел за линейна регресия, ще използваме библиотеката **Scikit-learn**. +За да обучим нашия модел на Линейна Регресия, ще използваме библиотеката **Scikit-learn**. ```python from sklearn.linear_model import LinearRegression @@ -183,69 +182,70 @@ from sklearn.metrics import mean_squared_error from sklearn.model_selection import train_test_split ``` -Започваме като разделяме входните стойности (характеристики) и очаквания изход (етикет) в отделни numpy масиви: +Започваме с разделяне на входните стойности (характеристики) и очаквания изход (етикет) в отделни numpy масиви: ```python X = pie_pumpkins['DayOfYear'].to_numpy().reshape(-1,1) y = pie_pumpkins['Price'] ``` -> Обърнете внимание, че трябваше да използваме `reshape` върху входните данни, за да може пакетът за линейна регресия да ги разбере правилно. Линейната регресия очаква 2D масив като вход, където всеки ред отговаря на вектор от входни характеристики. В нашия случай, тъй като имаме само една входна променлива - нужен е масив със форма N×1, където N е размерът на набора от данни. +> Обърнете внимание, че трябваше да извършим `reshape` върху входните данни, за да може пакетът за Линейна Регресия да ги разбере правилно. Линейната Регресия очаква 2D-масив като вход, където всеки ред на масива съответства на вектор от входни характеристики. В нашия случай, тъй като имаме само един вход, ни трябва масив с форма N×1, където N е размерът на набора от данни. -След това трябва да разделим данните на тренировъчен и тестов набор, за да можем да валидираме нашия модел след обучението: +След това трябва да разделим данните на обучаващ (train) и тестов (test) набор, за да можем да валидираме модела след обучението: ```python X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) ``` -Накрая, самото обучение на линейния регресионен модел отнема само два реда код. Дефинираме обект `LinearRegression` и го съобразяваме с нашите данни чрез метода `fit`: +Накрая, обучението на самия модел на Линейна Регресия отнема само два реда код. Дефинираме обект `LinearRegression` и го обучаваме с метода `fit` върху нашите данни: ```python lin_reg = LinearRegression() lin_reg.fit(X_train,y_train) ``` -Обектът `LinearRegression` след като бъде обучен (`fit`) съдържа всички коефициенти на регресията, които могат да се достъпят чрез свойството `.coef_`. В нашия случай има само един коефициент, който трябва да е около `-0.017`. Това означава, че цените изглежда леко спадат с времето, но не много, около 2 цента на ден. Можем също да получим пресечната точка на регресията с Y-оста използвайки `lin_reg.intercept_` - тя ще бъде около `21` в нашия случай, което индикира цената в началото на годината. +Обектът `LinearRegression` след като е бил трениран (`fit`) съдържа всички коефициенти на регресията, които могат да се достъпят чрез свойството `.coef_`. В нашия случай има само един коефициент, който трябва да е около `-0.017`. Това означава, че цените изглежда леко спадат с времето, но не много, около 2 цента на ден. Можем също така да достъпим точката на пресичане на регресията с Y-оста чрез `lin_reg.intercept_` - тя ще е около `21` в нашия случай, указвайки цената в началото на годината. -За да видим колко е точен нашият модел, можем да предскажем цените върху тестов набор от данни, и след това да измерим колко близки са нашите прогнози до очакваните стойности. Това може да стане с помощта на метриката средно квадратична грешка (MSE), която е средното на всички квадратични разлики между очакваната и предсказаната стойност. +За да видим колко е точен нашият модел, можем да предскажем цените върху тестов набор от данни и след това да измерим колко близо са предсказанията ни до очакваните стойности. Това може да се направи с помощта на метриката корен квадратен средна грешка (RMSE), която е корена на средната стойност на всички квадратирани разлики между очакваната и предсказаната стойност. ```python pred = lin_reg.predict(X_test) -mse = np.sqrt(mean_squared_error(y_test,pred)) -print(f'Mean error: {mse:3.3} ({mse/np.mean(pred)*100:3.3}%)') +rmse = np.sqrt(mean_squared_error(y_test,pred)) +print(f'RMSE: {rmse:3.3} ({rmse/np.mean(pred)*100:3.3}%)') ``` -Нашата грешка изглежда е около 2 точки, което е ~17%. Не е много добро. Друг индикатор за качество на модела е **коефициентът на детерминация**, който може да се получи по следния начин: +Грешката ни изглежда около 2 точки, което е ~17%. Не много добре. Друг индикатор за качество на модела е **коефициентът на детерминация**, който може да се получи така: ```python score = lin_reg.score(X_train,y_train) print('Model determination: ', score) ``` - Ако стойността е 0, това означава, че моделът не взема предвид входните данни и действа като *най-лошия линеен предиктор*, който е просто средната стойност на резултата. Стойност 1 означава, че можем перфектно да предскажем всички очаквани изходи. В нашия случай коефициентът е около 0.06, което е доста ниско. -Можем също да начертаем тестовите данни заедно с регресионната линия, за да видим по-добре как работи регресията при нас: +Ако стойността е 0, това означава, че моделът не взема предвид входните данни и действа като *най-лошия линеен предсказател*, което е просто средната стойност на резултата. Стойността 1 означава, че можем да предскажем перфектно всички очаквани изходи. В нашия случай коефициентът е около 0.06, което е доста ниско. + +Можем също да изобразим тестовите данни заедно с регресионната линия, за да видим по-добре как работи регресията в нашия случай: ```python plt.scatter(X_test,y_test) plt.plot(X_test,pred) ``` -Линейна регресия +Linear regression ## Полиномиална регресия -Друг вид линейна регресия е полиномиалната регресия. Докато понякога има линейна връзка между променливите – колкото по-голяма е тиквата като обем, толкова по-висока е цената – понякога тези връзки не могат да бъдат начертани като равнина или права линия. +Друг вид линейна регресия е полиномиалната регресия. Докато понякога има линейна зависимост между променливите - колкото по-голяма е тиквата като обем, толкова по-висока е цената - понякога тези зависимости не могат да се представят като равнина или права линия. -✅ Ето [още няколко примера](https://online.stat.psu.edu/stat501/lesson/9/9.8) на данни, които могат да използват полиномиална регресия. +✅ Ето [още няколко примера](https://online.stat.psu.edu/stat501/lesson/9/9.8) на данни, които биха могли да използват полиномиална регресия -Погледнете отново връзката между Дата и Цена. Изглежда ли тази точкова диаграма задължително да се анализира с права линия? Не може ли цените да варират? В този случай можете да опитате полиномиална регресия. +Погледнете отново връзката между дата и цена. Изглежда ли този график, че трябва непременно да бъде анализиран с права линия? Не могат ли цените да се колебаят? В този случай можете да опитате полиномиална регресия. ✅ Полиномите са математически изрази, които могат да съдържат една или повече променливи и коефициенти. -Полиномиалната регресия създава извита линия, която по-добре се адаптира към нелинейни данни. В нашия случай, ако включим квадратичната променлива `DayOfYear` в данните, трябва да можем да пригодим данните към параболична крива, която ще има минимум в определена точка през годината. +Полиномиалната регресия създава извита линия, за да пасне по-добре на нелинейните данни. В нашия случай, ако включим във входните данни квадратичната променлива `DayOfYear`, би трябвало да можем да напаснем данните с параболична крива, която ще има минимум в определена точка през годината. -Scikit-learn включва полезен [pipeline API](https://scikit-learn.org/stable/modules/generated/sklearn.pipeline.make_pipeline.html?highlight=pipeline#sklearn.pipeline.make_pipeline) за комбиниране на различни стъпки от обработката на данните. **Pipeline** е верига от **естиматори**. В нашия случай ще създадем pipeline, който първо добавя полиномни характеристики към нашия модел, а след това обучава регресията: +Scikit-learn включва полезен [pipeline API](https://scikit-learn.org/stable/modules/generated/sklearn.pipeline.make_pipeline.html?highlight=pipeline#sklearn.pipeline.make_pipeline) за комбиниране на различни стъпки от обработката на данни. **Pipeline** е верига от **оценители (estimators)**. В нашия случай ще създадем pipeline, който първо добавя полиномиални характеристики към модела, и след това тренира регресия: ```python from sklearn.preprocessing import PolynomialFeatures @@ -256,36 +256,36 @@ pipeline = make_pipeline(PolynomialFeatures(2), LinearRegression()) pipeline.fit(X_train,y_train) ``` -Използването на `PolynomialFeatures(2)` означава, че ще включим всички полиноми от втора степен от входните данни. В нашия случай това ще означава само `DayOfYear`2, но ако имаме две входни променливи X и Y, това ще добави X2, XY и Y2. Можем също да използваме полиноми с по-висока степен, ако искаме. +Използването на `PolynomialFeatures(2)` означава, че ще включим всички полиноми от втори ред от входните данни. В нашия случай това ще означава само `DayOfYear`2, но при наличието на две входни променливи X и Y, това ще добави X2, XY и Y2. Можем да използваме и полиноми с по-висока степен ако искаме. -Pipeline-ите могат да се използват по същия начин като оригиналния обект `LinearRegression`, тоест можем да `fit`-нем pipeline-а, и след това да използваме `predict` за получаване на резултатите от предвиждането. Ето графиката, показваща тестовите данни и приближаващата крива: +Pipeline-ите могат да се използват по същия начин като оригиналния обект `LinearRegression`, т.е. можем да направим `fit` на pipeline-а, и след това да използваме `predict`, за да получим резултатите от предсказването. Ето графика, показваща тестовите данни и крива на апроксимация: -Полиномиална регресия +Polynomial regression -Използвайки Полиномиална Регресия, можем да получим леко по-нисък MSE и по-висок коефициент на детерминация, но не значително. Трябва да вземем предвид и други характеристики! +С помощта на полиномиална регресия можем да получим леко по-ниска средна квадратична грешка и по-висок коефициент на детерминация, но незначително. Трябва да вземем предвид и други характеристики! -> Виждате, че минималните цени на тиквите са наблюдавани някъде около Хелоуин. Как бихте обяснили това? +> Можете да видите, че минималните цени на тиквите се наблюдават някъде около Хелоуин. Как бихте го обяснили? -🎃 Поздравления, току-що създадохте модел, който може да предсказва цената на питките тикви. Вероятно бихте могли да повторите същата процедура за всички видове тикви, но това би било уморително. Нека сега научим как да вземем предвид вида тиква в нашия модел! +🎃 Поздравления, току-що създадохте модел, който може да помага за предсказване на цената на тикви за пай. Вероятно можете да повторите същата процедура за всички видове тикви, но това би било досадно. Нека сега научим как да вземем предвид сорта тикви в нашия модел! ## Категориални характеристики -В идеалния свят искаме да можем да предсказваме цени за различни видове тикви с един и същ модел. Въпреки това, колоната `Variety` е някак различна от колони като `Month`, защото съдържа нечислови стойности. Такива колони се наричат **категориални**. +В идеалния свят искаме да можем да предсказваме цените за различни сортове тикви, използвайки същия модел. Въпреки това, колоната `Variety` е различна от колони като `Month`, защото съдържа ненумерични стойности. Такива колони се наричат **категориални**. -[![Машинно обучение за начинаещи - Предсказване с категориални характеристики с линейна регресия](https://img.youtube.com/vi/DYGliioIAE0/0.jpg)](https://youtu.be/DYGliioIAE0 "Машинно обучение за начинаещи - Предсказване с категориални характеристики с линейна регресия") +[![ML за начинаещи - Предсказване с категориални характеристики с линейна регресия](https://img.youtube.com/vi/DYGliioIAE0/0.jpg)](https://youtu.be/DYGliioIAE0 "ML за начинаещи - Предсказване с категориални характеристики с линейна регресия") -> 🎥 Кликнете върху изображението по-горе за кратко видео с обзор на използването на категориални характеристики. +> 🎥 Кликнете върху изображението по-горе за кратък видео преглед на използването на категориални характеристики. -Тук можете да видите как средната цена зависи от вида: +Тук можете да видите как средната цена зависи от сорта: -Средна цена по вид +Average price by variety -За да вземем предвид вида, първо трябва да го преобразуваме в числова форма, или да го **кодираме**. Има няколко начина, по които можем да го направим: +За да вземем предвид сорта, първо трябва да го преобразуваме в числова форма, или да го **кодираме**. Има няколко начина да го направим: -* Простото **числово кодиране** ще построи таблица с различните видове и след това ще замени името на вида с индекс в тази таблица. Това не е най-добрата идея за линейна регресия, защото линейната регресия взима действителната числова стойност на индекса и я добавя към резултата, умножавайки със съответния коефициент. В нашия случай връзката между числото на индекса и цената е ясно нелинейна, дори ако осигурим индексирането да е в някакъв определен ред. -* **One-hot encoding** ще замести колоната `Variety` с 4 отделни колони, по една за всеки вид. Всяка колона ще съдържа `1`, ако съответният ред е от даден вид, и `0` в противен случай. Това означава, че в линейната регресия ще има четири коефициента, един за всеки вид тиква, отговорни за "началната цена" (или по-скоро "допълнителната цена") за точно този вид. +* Простото **числово кодиране** ще изгради таблица на различни сортове, и ще замени името на сорта с индекс в тази таблица. Това не е най-добрата идея за линейна регресия, защото линейната регресия взема действителната числова стойност на индекса и я добавя към резултата, умножавайки по някакъв коефициент. В нашия случай връзката между номера на индекса и цената е явно нелинейна, дори ако направим така, че индексите да са подредени по някакъв конкретен начин. +* **One-hot кодиране** ще замени колоната `Variety` с 4 различни колони, по една за всеки сорт. Всяка колона ще съдържа `1`, ако съответният ред е от дадения сорт, и `0` в противен случай. Това означава, че в линейната регресия ще има четири коефициента, един за всеки сорт тикви, отговорни за „началната цена“ (по-скоро „допълнителна цена“) за този сорт. -Кодът по-долу показва как можем да направим one-hot енкодинг за вида: +Долният код показва как можем да приложим one-hot кодиране на сорта: ```python pd.get_dummies(new_pumpkins['Variety']) @@ -302,14 +302,14 @@ pd.get_dummies(new_pumpkins['Variety']) 1741 | 0 | 1 | 0 | 0 1742 | 0 | 1 | 0 | 0 -За да обучим линейната регресия с използване на one-hot кодиран вид като вход, просто трябва правилно да инициализираме данните `X` и „y“: +За да обучим линейна регресия, използвайки one-hot кодирания сорт като вход, просто трябва да инициализираме правилно данните `X` и `y`: ```python X = pd.get_dummies(new_pumpkins['Variety']) y = new_pumpkins['Price'] ``` -Останалата част от кода е същата като използваната по-горе за обучение на Linear Regression. Ако го изпробвате, ще видите, че средно квадратичната грешка е приблизително същата, но получаваме много по-висок коефициент на детерминация (~77%). За да получим още по-точни прогнози, можем да вземем предвид още категориални характеристики, както и числови характеристики, като `Month` или `DayOfYear`. За да получим един голям масив от характеристики, можем да използваме `join`: +Останалата част от кода е същата като тази, която използвахме по-горе за трениране на линейна регресия. Ако го изпробвате, ще видите, че средната квадратна грешка е приблизително същата, но получаваме много по-висок коефициент на детерминация (~77%). За да получим още по-точни предсказания, можем да вземем предвид повече категориални характеристики, както и числови признаци като `Month` или `DayOfYear`. За да получим един голям масив характеристики, можем да използваме `join`: ```python X = pd.get_dummies(new_pumpkins['Variety']) \ @@ -319,31 +319,31 @@ X = pd.get_dummies(new_pumpkins['Variety']) \ y = new_pumpkins['Price'] ``` -Тук също взимаме предвид `City` и типа `Package`, което ни дава MSE 2.84 (10%), и коефициент на детерминация 0.94! +Тук също вземаме предвид `City` и типа `Package`, което ни дава MSE 2.84 (10%) и коефициент на детерминация 0.94! -## Обединяване на всичко +## Обобщаване За да направим най-добрия модел, можем да използваме комбинирани (one-hot кодирани категориални + числови) данни от горния пример заедно с полиномиална регресия. Ето пълния код за ваше удобство: ```python -# настройте тренировъчните данни +# подготвяне на тренировъчните данни X = pd.get_dummies(new_pumpkins['Variety']) \ .join(new_pumpkins['Month']) \ .join(pd.get_dummies(new_pumpkins['City'])) \ .join(pd.get_dummies(new_pumpkins['Package'])) y = new_pumpkins['Price'] -# направете разделяне на тренировъчни и тестови данни +# направи разделяне на обучение и тест X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) -# настройте и обучете тръбопровода +# настрой и тренирай потока pipeline = make_pipeline(PolynomialFeatures(2), LinearRegression()) pipeline.fit(X_train,y_train) -# предскажете резултатите за тестовите данни +# предвиди резултатите за тестовите данни pred = pipeline.predict(X_test) -# изчислете средната квадратична грешка и коефициента на детерминация +# изчисли MSE и коефициент на детерминация mse = np.sqrt(mean_squared_error(y_test,pred)) print(f'Mean error: {mse:3.3} ({mse/np.mean(pred)*100:3.3}%)') @@ -351,36 +351,36 @@ score = pipeline.score(X_train,y_train) print('Model determination: ', score) ``` -Това би трябвало да ни даде най-добрия коефициент на детерминация от почти 97%, и MSE=2.23 (~8% грешка в предсказването). +Това трябва да ни даде най-добрия коефициент на детерминация от почти 97% и MSE=2.23 (~8% грешка при предсказване). | Модел | MSE | Коефициент на детерминация | |-------|-----|----------------------------| -| Линеен `DayOfYear` | 2.77 (17.2%) | 0.07 | -| Полиномиален `DayOfYear` | 2.73 (17.0%) | 0.08 | -| Линеен `Variety` | 5.24 (19.7%) | 0.77 | -| Линеен с всички характеристики | 2.84 (10.5%) | 0.94 | -| Полиномиален с всички характеристики | 2.23 (8.25%) | 0.97 | +| Линейна регресия със `DayOfYear` | 2.77 (17.2%) | 0.07 | +| Полиномиална регресия със `DayOfYear` | 2.73 (17.0%) | 0.08 | +| Линейна регресия с `Variety` | 5.24 (19.7%) | 0.77 | +| Линейна регресия с всички характеристики | 2.84 (10.5%) | 0.94 | +| Полиномиална регресия с всички характеристики | 2.23 (8.25%) | 0.97 | -🏆 Браво! Създадохте четири регресионни модела в един урок и подобрихте качеството на модела до 97%. В последния раздел за регресия ще научите за логистична регресия, която служи за класификация. +🏆 Отлична работа! Създадохте четири регресионни модела в един урок и подобрихте качеството на модела до 97%. В последната част за регресия ще научите за логистичната регресия за определяне на категории. --- ## 🚀Предизвикателство -Изпробвайте няколко различни променливи в този ноутбук, за да видите как корелацията съответства на точността на модела. +Тествайте няколко различни променливи в тази тетрадка, за да видите как корелацията съответства на точността на модела. -## [Квиз след лекцията](https://ff-quizzes.netlify.app/en/ml/) +## [Викторина след лекцията](https://ff-quizzes.netlify.app/en/ml/) -## Преглед и Самостоятелно обучение +## Преглед и самообучение -В този урок научихме за линейната регресия. Съществуват и други важни видове регресия. Прочетете за техниките Stepwise, Ridge, Lasso и Elasticnet. Добър курс за допълнително обучение е [Stanford Statistical Learning course](https://online.stanford.edu/courses/sohs-ystatslearning-statistical-learning) +В този урок научихме за линейната регресия. Има и други важни видове регресия. Прочетете за техническите подходи Stepwise, Ridge, Lasso и Elasticnet. Добър курс за по-задълбочено изучаване е [Stanford Statistical Learning course](https://online.stanford.edu/courses/sohs-ystatslearning-statistical-learning) ## Задача -[Създайте модел](assignment.md) +[Изградете модел](assignment.md) --- **Отказ от отговорност**: -Този документ е преведен с помощта на AI услуга за превод [Co-op Translator](https://github.com/Azure/co-op-translator). Въпреки че се стремим към точност, имайте предвид, че автоматичните преводи могат да съдържат грешки или неточности. Оригиналният документ на неговия език трябва да се счита за авторитетен източник. За критична информация се препоръчва професионален човешки превод. Не носим отговорност за каквито и да е недоразумения или погрешни тълкувания, произтичащи от използването на този превод. +Този документ е преведен с помощта на AI преводаческа услуга [Co-op Translator](https://github.com/Azure/co-op-translator). Въпреки че се стремим към точност, моля, имайте предвид, че автоматизираните преводи могат да съдържат грешки или неточности. Оригиналният документ на неговия език трябва да се счита за авторитетен източник. За критична информация се препоръчва професионален човешки превод. Не носим отговорност за никакви недоразумения или погрешни тълкувания, произтичащи от използването на този превод. \ No newline at end of file diff --git a/translations/bg/4-Classification/2-Classifiers-1/README.md b/translations/bg/4-Classification/2-Classifiers-1/README.md index 3b6ad445b..7bd2974ec 100644 --- a/translations/bg/4-Classification/2-Classifiers-1/README.md +++ b/translations/bg/4-Classification/2-Classifiers-1/README.md @@ -1,17 +1,17 @@ -# Класификатори за кухни 1 +# Класификатори на кухни 1 -В този урок ще използвате набора от данни, който запазихте от предишния урок, пълен с балансирани и почистени данни за различни кухни. +В този урок ще използвате набора от данни, който запазихте от последния урок, пълен с балансирани, чисти данни, свързани с кухни. -Ще използвате този набор от данни с разнообразие от класификатори, за да _предвидите дадена национална кухня въз основа на група съставки_. Докато правите това, ще научите повече за някои от начините, по които алгоритмите могат да бъдат използвани за задачи по класификация. +Ще използвате този набор от данни с различни класификатори, за да _предскажете дадена национална кухня въз основа на група съставки_. Докато го правите, ще научите повече за някои от начините, по които алгоритмите могат да се използват за задачи по класификация. -## [Тест преди лекцията](https://ff-quizzes.netlify.app/en/ml/) +## [Предварителен тест преди лекцията](https://ff-quizzes.netlify.app/en/ml/) # Подготовка -При условие че сте завършили [Урок 1](../1-Introduction/README.md), уверете се, че файлът _cleaned_cuisines.csv_ съществува в основната папка `/data` за тези четири урока. +Предполагайки, че сте завършили [Урок 1](../1-Introduction/README.md), уверете се, че файлът _cleaned_cuisines.csv_ съществува в главната папка `/data` за тези четири урока. -## Упражнение - предвиждане на национална кухня +## Упражнение - предсказване на национална кухня -1. Работейки в папката _notebook.ipynb_ на този урок, импортирайте този файл заедно с библиотеката Pandas: +1. Работейки в папката с _notebook.ipynb_ за този урок, импортирайте този файл заедно с библиотеката Pandas: ```python import pandas as pd @@ -40,7 +40,7 @@ import numpy as np ``` -1. Разделете X и y координатите в два датафрейма за обучение. `cuisine` може да бъде датафреймът с етикети: +1. Разделете координатите X и y в два датафрейма за обучение. `cuisine` може да бъде датафреймът с етикети: ```python cuisines_label_df = cuisines_df['cuisine'] @@ -58,14 +58,14 @@ Name: cuisine, dtype: object ``` -1. Премахнете колоната `Unnamed: 0` и колоната `cuisine`, използвайки `drop()`. Запазете останалите данни като обучаеми характеристики: +1. Изхвърлете колоните `Unnamed: 0` и `cuisine`, като използвате `drop()`. Запазете останалите данни като функции за обучение: ```python cuisines_feature_df = cuisines_df.drop(['Unnamed: 0', 'cuisine'], axis=1) cuisines_feature_df.head() ``` - Вашите характеристики изглеждат така: + Вашите функции изглеждат така: | | almond | angelica | anise | anise_seed | apple | apple_brandy | apricot | armagnac | artemisia | artichoke | ... | whiskey | white_bread | white_wine | whole_grain_wheat_flour | wine | wood | yam | yeast | yogurt | zucchini | | ---: | -----: | -------: | ----: | ---------: | ----: | -----------: | ------: | -------: | --------: | --------: | ---: | ------: | ----------: | ---------: | ----------------------: | ---: | ---: | ---: | ----: | -----: | -------: | @@ -75,85 +75,85 @@ | 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | -Сега сте готови да обучите модела си! +Сега сте готови да обучите вашия модел! ## Избор на класификатор -Сега, когато данните ви са почистени и готови за обучение, трябва да решите кой алгоритъм да използвате за задачата. +След като данните ви са чисти и готови за обучение, трябва да решите кой алгоритъм да използвате. -Scikit-learn групира класификацията под Надзорно Обучение, и в тази категория ще намерите много начини за класифициране. [Разнообразието](https://scikit-learn.org/stable/supervised_learning.html) може да изглежда объркващо на пръв поглед. Следните методи включват техники за класификация: +Scikit-learn групира класификацията под Контролирано обучение, а в тази категория ще намерите много начини за класифициране. [Разнообразието](https://scikit-learn.org/stable/supervised_learning.html) е доста объркващо на пръв поглед. Следните методи включват техники за класификация: - Линейни модели -- Машини за опорни вектори -- Стохастичен градиентен спуск +- Машини с опорни вектори +- Стохастичен градиентен спад - Най-близки съседи - Гаусови процеси -- Дървета за решения -- Методи на ансамбъл (гласуващ класификатор) -- Мултикласови и мултиизходни алгоритми (мултикласова и мултиетикетна класификация, мултикласова-мултиизходна класификация) +- Дървета за вземане на решения +- Методи ансамбли (гласуващ класификатор) +- Мултикласови и мултиизходни алгоритми (мултикласова и мултиетикетна класификация, мултикласова мултиизходна класификация) > Можете също да използвате [невронни мрежи за класифициране на данни](https://scikit-learn.org/stable/modules/neural_networks_supervised.html#classification), но това е извън обхвата на този урок. -### Какъв класификатор да изберете? +### Кой класификатор да изберете? -И така, кой класификатор трябва да изберете? Често, преминаването през няколко и търсенето на добър резултат е начин за тестване. Scikit-learn предлага [сравнение рамо до рамо](https://scikit-learn.org/stable/auto_examples/classification/plot_classifier_comparison.html) на създаден набор от данни, сравнявайки KNeighbors, SVC по два начина, GaussianProcessClassifier, DecisionTreeClassifier, RandomForestClassifier, MLPClassifier, AdaBoostClassifier, GaussianNB и QuadraticDiscriminationAnalysis, показвайки резултатите визуализирани: +И така, кой класификатор да изберете? Често е полезно да изпробвате няколко и да видите за добър резултат. Scikit-learn предлага [паралелно сравнение](https://scikit-learn.org/stable/auto_examples/classification/plot_classifier_comparison.html) върху създаден набор от данни, сравнявайки KNeighbors, SVC по два начина, GaussianProcessClassifier, DecisionTreeClassifier, RandomForestClassifier, MLPClassifier, AdaBoostClassifier, GaussianNB и QuadraticDiscrinationAnalysis, като резултатите са визуализирани: -![сравнение на класификатори](../../../../4-Classification/2-Classifiers-1/images/comparison.png) -> Графики, генерирани от документацията на Scikit-learn +![сравнение на класификатори](../../../../translated_images/bg/comparison.edfab56193a85e7f.webp) +> Графики, генерирани в документацията на Scikit-learn -> AutoML решава този проблем лесно, като изпълнява тези сравнения в облака, позволявайки ви да изберете най-добрия алгоритъм за вашите данни. Опитайте [тук](https://docs.microsoft.com/learn/modules/automate-model-selection-with-azure-automl/?WT.mc_id=academic-77952-leestott) +> AutoML решава този проблем елегантно, като изпълнява тези сравнения в облака, позволявайки ви да изберете най-добрия алгоритъм за вашите данни. Опитайте [тук](https://docs.microsoft.com/learn/modules/automate-model-selection-with-azure-automl/?WT.mc_id=academic-77952-leestott) ### По-добър подход -По-добър начин от случайното предположение е да следвате идеите от този изтегляем [ML Cheat sheet](https://docs.microsoft.com/azure/machine-learning/algorithm-cheat-sheet?WT.mc_id=academic-77952-leestott). Тук откриваме, че за нашия мултикласов проблем имаме някои опции: +По-добър начин от безразборното гадаене е да следвате идеите в този изтегляем [ML Cheat sheet](https://docs.microsoft.com/azure/machine-learning/algorithm-cheat-sheet?WT.mc_id=academic-77952-leestott). Тук откриваме, че за нашия мултикласов проблем имаме някои избори: -![cheatsheet за мултикласови проблеми](../../../../4-Classification/2-Classifiers-1/images/cheatsheet.png) -> Част от Cheat Sheet на Microsoft за алгоритми, описваща опции за мултикласова класификация +![чийтшит за мултикласови проблеми](../../../../translated_images/bg/cheatsheet.07a475ea444d2223.webp) +> Част от списъка с алгоритми на Microsoft, описваща опции за мултикласова класификация -✅ Изтеглете този cheat sheet, разпечатайте го и го закачете на стената си! +✅ Изтеглете този чийтшит, разпечатайте го и го закачете на стената си! -### Разсъждения +### Обосновка -Нека видим дали можем да разсъждаваме върху различни подходи, като се вземат предвид ограниченията, които имаме: +Нека да видим дали можем да разсъдим различни подходи с оглед на ограниченията, които имаме: -- **Невронните мрежи са твърде тежки**. Като се има предвид нашият почистен, но минимален набор от данни и фактът, че изпълняваме обучението локално чрез ноутбуци, невронните мрежи са твърде тежки за тази задача. -- **Не използваме двукласов класификатор**. Не използваме двукласов класификатор, така че това изключва one-vs-all. -- **Дърво за решения или логистична регресия може да работи**. Дърво за решения може да работи, или логистична регресия за мултикласови данни. -- **Мултикласовите Boosted Decision Trees решават различен проблем**. Мултикласовото Boosted Decision Tree е най-подходящо за непараметрични задачи, например задачи, предназначени за изграждане на класации, така че не е полезно за нас. +- **Невронните мрежи са твърде тежки**. Като имаме чист, но минимален набор от данни и факта, че обучението се изпълнява локално чрез тетрадки, невронните мрежи са твърде тежки за тази задача. +- **Без двукласови класификатори**. Не използваме двукласови класификатори, което изключва one-vs-all. +- **Дърво за решения или логистична регресия могат да работят**. Дървото за решения може да свърши работа, или логистичната регресия за мултикласови данни. +- **Мултикласовите засилени дървета за решения решават друг проблем**. Мултикласовото засилено дърво е най-подходящо за непараметрични задачи, например задачи за изграждане на ранжиране, така че не е полезно за нас. -### Използване на Scikit-learn +### Използване на Scikit-learn -Ще използваме Scikit-learn за анализ на нашите данни. Въпреки това, има много начини за използване на логистична регресия в Scikit-learn. Вижте [параметрите за предаване](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html?highlight=logistic%20regressio#sklearn.linear_model.LogisticRegression). +Ще използваме Scikit-learn за анализ на нашите данни. Въпреки това има много начини за използване на логистична регресия в Scikit-learn. Вижте [параметрите, които трябва да зададете](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html?highlight=logistic%20regressio#sklearn.linear_model.LogisticRegression). -По същество има два важни параметъра - `multi_class` и `solver` - които трябва да зададем, когато поискаме от Scikit-learn да изпълни логистична регресия. Стойността на `multi_class` прилага определено поведение. Стойността на solver определя кой алгоритъм да се използва. Не всички solver могат да се комбинират с всички стойности на `multi_class`. +По същество има два важни параметъра - `multi_class` и `solver` - които трябва да зададем, когато искаме Scikit-learn да изпълни логистична регресия. Стойността на `multi_class` прилага определено поведение. Стойността на solver е кой алгоритъм да се използва. Не всички solver-и могат да се сдвояват с всички `multi_class` стойности. -Според документацията, в случая на мултиклас, алгоритъмът за обучение: +Според документацията, в мултикласовия случай, алгоритъмът за обучение: -- **Използва схемата one-vs-rest (OvR)**, ако опцията `multi_class` е зададена на `ovr` -- **Използва загубата на кръстосана ентропия**, ако опцията `multi_class` е зададена на `multinomial`. (В момента опцията `multinomial` се поддържа само от solver-ите ‘lbfgs’, ‘sag’, ‘saga’ и ‘newton-cg’.)" +- **Използва схемата one-vs-rest (OvR)**, ако опцията `multi_class` е настроена на `ovr` +- **Използва крос-ентропийна загуба**, ако опцията `multi_class` е настроена на `multinomial`. (В момента опцията `multinomial` се поддържа само от solver-ите ‘lbfgs’, ‘sag’, ‘saga’ и ‘newton-cg’)." -> 🎓 "Схемата" тук може да бъде 'ovr' (one-vs-rest) или 'multinomial'. Тъй като логистичната регресия е наистина предназначена да поддържа бинарна класификация, тези схеми й позволяват да се справя по-добре с задачи за мултикласова класификация. [източник](https://machinelearningmastery.com/one-vs-rest-and-one-vs-one-for-multi-class-classification/) +> 🎓 "Схемата" тук може да бъде 'ovr' (one-vs-rest) или 'multinomial'. Тъй като логистичната регресия е създадена предимно за бинарна класификация, тези схеми позволяват по-добро справяне с мултикласови задачи. [източник](https://machinelearningmastery.com/one-vs-rest-and-one-vs-one-for-multi-class-classification/) -> 🎓 "Solver" се определя като "алгоритъмът, който да се използва в проблема за оптимизация". [източник](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html?highlight=logistic%20regressio#sklearn.linear_model.LogisticRegression). +> 🎓 "solver" е дефиниран като "алгоритъмът, който се използва в оптимизационната задача". [източник](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html?highlight=logistic%20regressio#sklearn.linear_model.LogisticRegression). -Scikit-learn предлага тази таблица, за да обясни как solver-ите се справят с различни предизвикателства, представени от различни видове структури на данни: +Scikit-learn предлага тази таблица, за да обясни как solver-ите се справят с различните предизвикателства, представени от различни видове структури на данни: -![solver-и](../../../../4-Classification/2-Classifiers-1/images/solvers.png) +![solver-и](../../../../translated_images/bg/solvers.5fc648618529e627.webp) ## Упражнение - разделяне на данните -Можем да се фокусираме върху логистичната регресия за първия ни опит за обучение, тъй като наскоро научихте за нея в предишен урок. -Разделете данните си на групи за обучение и тестване, като извикате `train_test_split()`: +Можем да се фокусираме върху логистичната регресия за първия опит за обучение, тъй като наскоро научихте за нея в предишен урок. +Разделете данните си на тренировъчни и тестови групи, като извикате `train_test_split()`: ```python X_train, X_test, y_train, y_test = train_test_split(cuisines_feature_df, cuisines_label_df, test_size=0.3) ``` -## Упражнение - прилагане на логистична регресия +## Упражнение - приложете логистична регресия -Тъй като използвате случая на мултиклас, трябва да изберете каква _схема_ да използвате и какъв _solver_ да зададете. Използвайте LogisticRegression с настройка за мултиклас и solver **liblinear** за обучение. +Тъй като използвате мултикласовия случай, трябва да изберете коя _схема_ да използвате и кой _solver_ да зададете. Използвайте LogisticRegression с мултикласова настройка и **liblinear** solver за обучение. -1. Създайте логистична регресия с multi_class, зададено на `ovr`, и solver, зададен на `liblinear`: +1. Създайте логистична регресия с `multi_class` настроено на `ovr` и solver - `liblinear`: ```python lr = LogisticRegression(multi_class='ovr',solver='liblinear') @@ -163,11 +163,13 @@ X_train, X_test, y_train, y_test = train_test_split(cuisines_feature_df, cuisine print ("Accuracy is {}".format(accuracy)) ``` - ✅ Опитайте различен solver като `lbfgs`, който често е зададен като стандартен -> Забележка: Използвайте функцията Pandas [`ravel`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.ravel.html), за да изравните данните си, когато е необходимо. -Точността е добра при над **80%**! + ✅ Опитайте различен solver като `lbfgs`, който често е по подразбиране -1. Можете да видите този модел в действие, като тествате един ред данни (#50): + > Забележка: използвайте функцията [`ravel`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.ravel.html) на Pandas, за да развиете данните си, когато е необходимо. + + Точността е добра - над **80%**! + +1. Можете да видите този модел в действие, като тествате ред №50: ```python print(f'ingredients: {X_test.iloc[50][X_test.iloc[50]!=0].keys()}') @@ -181,9 +183,8 @@ X_train, X_test, y_train, y_test = train_test_split(cuisines_feature_df, cuisine cuisine: indian ``` - ✅ Опитайте с различен номер на ред и проверете резултатите. - -1. Ако искате да се задълбочите, можете да проверите точността на тази прогноза: + ✅ Опитайте с друг номер на ред и проверете резултатите +1. Копайки по-надълбоко, можете да проверите точността на тази прогноза: ```python test= X_test.iloc[50].values.reshape(-1, 1).T @@ -195,7 +196,7 @@ X_train, X_test, y_train, y_test = train_test_split(cuisines_feature_df, cuisine topPrediction.head() ``` - Резултатът се отпечатва - индийската кухня е най-доброто предположение, с добра вероятност: + Резултатът е отпечатан - индийската кухня е най-добрата му предположение, с добра вероятност: | | 0 | | -------: | -------: | @@ -207,7 +208,7 @@ X_train, X_test, y_train, y_test = train_test_split(cuisines_feature_df, cuisine ✅ Можете ли да обясните защо моделът е доста сигурен, че това е индийска кухня? -1. Получете повече подробности, като отпечатате отчет за класификация, както направихте в уроците за регресия: +1. Получете повече подробности, като отпечатате отчет за класификацията, както направихте в уроците по регресия: ```python y_pred = model.predict(X_test) @@ -221,24 +222,26 @@ X_train, X_test, y_train, y_test = train_test_split(cuisines_feature_df, cuisine | japanese | 0.70 | 0.75 | 0.72 | 220 | | korean | 0.86 | 0.76 | 0.81 | 242 | | thai | 0.79 | 0.85 | 0.82 | 254 | - | accuracy | 0.80 | 1199 | | | + | accuracy | | | 0.80 | 1199 | | macro avg | 0.80 | 0.80 | 0.80 | 1199 | | weighted avg | 0.80 | 0.80 | 0.80 | 1199 | ## 🚀Предизвикателство -В този урок използвахте почистените си данни, за да изградите модел за машинно обучение, който може да предскаже национална кухня въз основа на серия от съставки. Отделете време да разгледате многото опции, които Scikit-learn предоставя за класифициране на данни. Задълбочете се в концепцията за 'solver', за да разберете какво се случва зад кулисите. +В този урок използвахте почистените си данни, за да изградите модел за машинно обучение, който може да предскаже национална кухня въз основа на поредица от съставки. Отделете време да разгледате многото опции, които Scikit-learn предоставя за класифициране на данни. Проучете по-задълбочено концепцията за 'solver', за да разберете какво се случва зад кулисите. -## [Тест след лекцията](https://ff-quizzes.netlify.app/en/ml/) +## [Квиз след лекцията](https://ff-quizzes.netlify.app/en/ml/) -## Преглед и самостоятелно обучение +## Преглед и Самостоятелно обучение -Разгледайте малко повече математиката зад логистичната регресия в [този урок](https://people.eecs.berkeley.edu/~russell/classes/cs194/f11/lectures/CS194%20Fall%202011%20Lecture%2006.pdf) -## Задача +Разгледайте по-подробно математиката зад логистичната регресия в [този урок](https://people.eecs.berkeley.edu/~russell/classes/cs194/f11/lectures/CS194%20Fall%202011%20Lecture%2006.pdf) +## Задание -[Проучете решаващите алгоритми](assignment.md) +[Изучете solver-ите](assignment.md) --- + **Отказ от отговорност**: -Този документ е преведен с помощта на AI услуга за превод [Co-op Translator](https://github.com/Azure/co-op-translator). Въпреки че се стремим към точност, моля, имайте предвид, че автоматизираните преводи може да съдържат грешки или неточности. Оригиналният документ на неговия роден език трябва да се счита за авторитетен източник. За критична информация се препоръчва професионален човешки превод. Ние не носим отговорност за недоразумения или погрешни интерпретации, произтичащи от използването на този превод. \ No newline at end of file +Този документ е преведен с помощта на AI преводаческа услуга [Co-op Translator](https://github.com/Azure/co-op-translator). Въпреки че се стремим към точност, моля, имайте предвид, че автоматизираните преводи могат да съдържат грешки или неточности. Оригиналният документ на неговия роден език трябва да се счита за авторитетен източник. За критична информация се препоръчва професионален човешки превод. Ние не носим отговорност за всякакви недоразумения или неправилни тълкувания, произтичащи от използването на този превод. + \ No newline at end of file diff --git a/translations/bg/README.md b/translations/bg/README.md index a477ac587..673a7ceb9 100644 --- a/translations/bg/README.md +++ b/translations/bg/README.md @@ -8,16 +8,16 @@ [![GitHub forks](https://img.shields.io/github/forks/microsoft/ML-For-Beginners.svg?style=social&label=Fork)](https://GitHub.com/microsoft/ML-For-Beginners/network/) [![GitHub stars](https://img.shields.io/github/stars/microsoft/ML-For-Beginners.svg?style=social&label=Star)](https://GitHub.com/microsoft/ML-For-Beginners/stargazers/) -### 🌐 Многоезична поддръжка +### 🌐 Поддръжка на множество езици -#### Поддържа се чрез GitHub Action (автоматично и винаги актуално) +#### Поддържана чрез GitHub Action (Автоматизирана и винаги актуална) [Arabic](../ar/README.md) | [Bengali](../bn/README.md) | [Bulgarian](./README.md) | [Burmese (Myanmar)](../my/README.md) | [Chinese (Simplified)](../zh-CN/README.md) | [Chinese (Traditional, Hong Kong)](../zh-HK/README.md) | [Chinese (Traditional, Macau)](../zh-MO/README.md) | [Chinese (Traditional, Taiwan)](../zh-TW/README.md) | [Croatian](../hr/README.md) | [Czech](../cs/README.md) | [Danish](../da/README.md) | [Dutch](../nl/README.md) | [Estonian](../et/README.md) | [Finnish](../fi/README.md) | [French](../fr/README.md) | [German](../de/README.md) | [Greek](../el/README.md) | [Hebrew](../he/README.md) | [Hindi](../hi/README.md) | [Hungarian](../hu/README.md) | [Indonesian](../id/README.md) | [Italian](../it/README.md) | [Japanese](../ja/README.md) | [Kannada](../kn/README.md) | [Khmer](../km/README.md) | [Korean](../ko/README.md) | [Lithuanian](../lt/README.md) | [Malay](../ms/README.md) | [Malayalam](../ml/README.md) | [Marathi](../mr/README.md) | [Nepali](../ne/README.md) | [Nigerian Pidgin](../pcm/README.md) | [Norwegian](../no/README.md) | [Persian (Farsi)](../fa/README.md) | [Polish](../pl/README.md) | [Portuguese (Brazil)](../pt-BR/README.md) | [Portuguese (Portugal)](../pt-PT/README.md) | [Punjabi (Gurmukhi)](../pa/README.md) | [Romanian](../ro/README.md) | [Russian](../ru/README.md) | [Serbian (Cyrillic)](../sr/README.md) | [Slovak](../sk/README.md) | [Slovenian](../sl/README.md) | [Spanish](../es/README.md) | [Swahili](../sw/README.md) | [Swedish](../sv/README.md) | [Tagalog (Filipino)](../tl/README.md) | [Tamil](../ta/README.md) | [Telugu](../te/README.md) | [Thai](../th/README.md) | [Turkish](../tr/README.md) | [Ukrainian](../uk/README.md) | [Urdu](../ur/README.md) | [Vietnamese](../vi/README.md) > **Предпочитате да клонирате локално?** > -> Това хранилище включва 50+ езикови превода, което значително увеличава размера на изтеглянето. За да клонирате без преводи, използвайте sparse checkout: +> Този репозиторий включва повече от 50 езикови превода, което значително увеличава размера на изтеглянето. За да клонирате без преводи, използвайте sparse checkout: > > **Bash / macOS / Linux:** > ```bash @@ -33,63 +33,63 @@ > git sparse-checkout set --no-cone "/*" "!translations" "!translated_images" > ``` > -> Това ви осигурява всичко необходимо за завършване на курса с много по-бързо изтегляне. +> Това ви дава всичко необходимо за завършване на курса с много по-бързо изтегляне. #### Присъединете се към нашата общност [![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG) -Имаме серия в Discord за учене с AI, научете повече и се присъединете към нас на [Learn with AI Series](https://aka.ms/learnwithai/discord) от 18 до 30 септември 2025 г. Ще получите съвети и трикове за използване на GitHub Copilot за Data Science. +Текуща серия в Discord за учене с AI, научете повече и се присъединете към нас на [Learn with AI Series](https://aka.ms/learnwithai/discord) от 18 до 30 септември 2025 г. Ще получите съвети и трикове за използване на GitHub Copilot за Data Science. ![Learn with AI series](../../translated_images/bg/3.9b58fd8d6c373c20.webp) -# Машинно обучение за начинаещи – учебна програма +# Машинно обучение за начинаещи - учебна програма -> 🌍 Пътувайте по света, докато изследваме Машинното обучение чрез световните култури 🌍 +> 🌍 Пътувайте по света, докато изследваме машинното обучение чрез културите на света 🌍 -Cloud Advocates в Microsoft с радост предлагат 12-седмична, 26-урочна учебна програма изцяло посветена на **Машинното обучение**. В тази учебна програма ще научите за това, което понякога се нарича **класическо машинно обучение**, използвайки основно библиотеката Scikit-learn и избягвайки дълбокото обучение, което е разгледано в нашата учебна програма [AI за начинаещи](https://aka.ms/ai4beginners). Съчетавайте тези уроци с нашата учебна програма ['Data Science за начинаещи'](https://aka.ms/ds4beginners), също! +Облачените адвокати на Microsoft с удоволствие предлагат 12-седмична учебна програма с 26 урока, посветени на **машинно обучение**. В тази учебна програма ще научите за това, което понякога се нарича **класическо машинно обучение**, като се използва основно библиотеката Scikit-learn и се избягва дълбокото учене, което е покрито в нашата учебна програма [AI за начинаещи](https://aka.ms/ai4beginners). Комбинирайте тези уроци с нашата учебна програма ['Data Science за начинаещи'](https://aka.ms/ds4beginners) също! -Пътувайте с нас по света, докато прилагаме тези класически техники върху данни от различни региони на света. Всеки урок включва тестове преди и след урока, писмени инструкции за завършване на урока, решение, задача и други. Нашата проектно базирана педагогика ви позволява да учите чрез изграждане, което е доказан начин за усвояване на нови умения. +Пътувайте с нас по света, докато прилагаме тези класически техники върху данни от много части на света. Всеки урок включва предварителни и последващи тестове, писмени инструкции за завършване на урока, решение, задача и още. Нашата проектно-базирана педагогика ви позволява да учите, докато изграждате, което е доказан начин новите умения да "се задържат". -**✍️ Сърдечни благодарности на нашите автори** Джен Лупър, Стивън Хауъл, Франческа Лазери, Томоми Имура, Каси Бревиу, Дмитрий Сошников, Крис Норинг, Анирбан Мукерджи, Орнела Алтунян, Рут Якубу и Ейми Бойд +**✍️ Големи благодарности на авторите ни** Джен Лупър, Стивън Хауел, Франческа Лаззери, Томоми Имура, Каси Бревиу, Дмитрий Сошников, Крис Норинг, Анибан Мукержи, Орнела Алтунян, Рут Якобу и Ейми Бойд -**🎨 Благодарности и на нашите илюстратори** Томоми Имура, Дасани Мадипали и Джен Лупър +**🎨 Благодаря и на илюстраторите ни** Томоми Имура, Дасани Мадипали и Джен Лупър -**🙏 Специални благодарности 🙏 на нашите автори, рецензенти и съдържателни сътрудници от Microsoft Student Ambassador**, особено Ришит Дагли, Мухаммад Сакиб Кан Инан, Рохан Радж, Александру Петреску, Абхишек Джайсвал, Науирин Табасум, Йоан Самуила и Снигдха Агарвал +**🙏 Специални благодарности 🙏 на нашите студенти посланици на Microsoft, които са автори, рецензенти и допринасят с съдържание**, особено Ришит Дагли, Мухамад Сакиб Хан Инан, Рохан Радж, Александру Петреску, Абхишек Джаисвал, Наурин Табасум, Йоан Самиюла и Снигдха Агарвал -**🤩 Допълнителна благодарност на Microsoft Student Ambassadors Ерик Уанджау, Жаслийн Сонди и Видуши Гупта за нашите R уроци!** +**🤩 Допълнителни благодарности на Microsoft студентските посланици Ерик Уанджау, Джаслийн Сонди и Вишуди Гупта за нашите R уроци!** # Започване Следвайте тези стъпки: -1. **Форкнете хранилището**: Кликнете бутона "Fork" в горния десен ъгъл на тази страница. -2. **Клонирайте хранилището**: `git clone https://github.com/microsoft/ML-For-Beginners.git` +1. **Разклонете Репозитория**: Натиснете бутона "Fork" в горния десен ъгъл на тази страница. +2. **Клонирайте Репозитория**: `git clone https://github.com/microsoft/ML-For-Beginners.git` -> [намерете всички допълнителни ресурси за този курс в нашата колекция в Microsoft Learn](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) +> [намерете всички допълнителни ресурси за този курс в нашата колекция Microsoft Learn](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) -> 🔧 **Нуждаете се от помощ?** Разгледайте нашето [Ръководство за отстраняване на проблеми](TROUBLESHOOTING.md) за решения на често срещани проблеми с инсталирането, настройката и стартирането на уроци. +> 🔧 **Нуждаете се от помощ?** Проверете нашето [Ръководство за отстраняване на проблеми](TROUBLESHOOTING.md) за решения на често срещани проблеми с инсталация, настройка и изпълнение на уроци. -**[Студенти](https://aka.ms/student-page)**, за да използвате тази учебна програма, форкнете цялото хранилище в собствения си GitHub акаунт и изпълнете упражненията сами или в група: +**[Студенти](https://aka.ms/student-page)**, за да използвате тази учебна програма, разклонете целия репозитори в собствен акаунт в GitHub и изпълнете упражненията сами или в група: -- Започнете с тест преди урока. -- Прочетете урока и изпълнете дейностите, спирайки се и разсъждавайки при всяка проверка на знанията. -- Опитайте се да създадете проектите чрез разбиране на уроците, а не просто чрез стартиране на кода за решения; този код обаче е наличен в папките `/solution` във всеки урок, ориентиран към проект. -- Направете тест след урока. -- Изпълнете предизвикателството. -- Извършете задачата. -- След като завършите група уроци, посетете [Дискусионния борд](https://github.com/microsoft/ML-For-Beginners/discussions) и "учете на глас", като попълните подходящата рубрика PAT. PAT е инструмент за оценка на напредъка, който попълвате, за да задълбочите ученето си. Можете също да реагирате на други PAT-ове, за да се учим заедно. +- Започнете с предварителен тест преди лекцията. +- Прочетете лекцията и завършете дейностите, паузирайки и размишлявайки при всяка проверка на знания. +- Опитайте се да създадете проектите като разбирате уроците, а не като просто стартирате кода с решения; въпреки това този код е достъпен в папките `/solution` във всеки проектно-ориентиран урок. +- Направете теста след лекцията. +- Завършете предизвикателството. +- Завършете задачата. +- След завършване на група уроци посетете [Дискусионния форум](https://github.com/microsoft/ML-For-Beginners/discussions) и "учете на глас", като попълните подходящата PAT рубрика. PAT е инструмент за оценка на напредъка, който попълвате, за да подобрите ученето си. Можете също да реагирате на други PAT, за да учим заедно. -> За допълнително обучение, препоръчваме да следвате тези [модули и учебни пътеки на Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/k7o7tg1gp306q4?WT.mc_id=academic-77952-leestott). +> За по-нататъшно обучение препоръчваме да следвате тези [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/k7o7tg1gp306q4?WT.mc_id=academic-77952-leestott) модули и учебни пътеки. -**Учители**, включили сме [някои предложения](for-teachers.md) как да използвате тази учебна програма. +**Учители**, ние сме включили [някои предложения](for-teachers.md) как да използвате тази учебна програма. --- ## Видео уроци -Някои от уроците са налични като кратки видеа. Можете да ги намерите в текста на уроците или в [плейлиста ML за начинаещи в канала на Microsoft Developer в YouTube](https://aka.ms/ml-beginners-videos) чрез клик върху изображението по-долу. +Някои от уроците са налични като кратки видеоклипове. Можете да ги намерите всички в уроците или в плейлиста [ML for Beginners в канала на Microsoft Developer в YouTube](https://aka.ms/ml-beginners-videos), като кликнете на изображението по-долу. [![ML for beginners banner](../../translated_images/bg/ml-for-beginners-video-banner.63f694a100034bc6.webp)](https://aka.ms/ml-beginners-videos) @@ -99,7 +99,7 @@ Cloud Advocates в Microsoft с радост предлагат 12-седмич [![Promo video](../../images/ml.gif)](https://youtu.be/Tj1XWrDSYJU) -**Gif от** [Mohit Jaisal](https://linkedin.com/in/mohitjaisal) +**Гиф от** [Mohit Jaisal](https://linkedin.com/in/mohitjaisal) > 🎥 Кликнете върху изображението по-горе за видео за проекта и хората, които го създадоха! @@ -107,73 +107,72 @@ Cloud Advocates в Microsoft с радост предлагат 12-седмич ## Педагогика -Избрахме две педагогически принципа при създаването на тази учебна програма: гарантираме, че тя е практически ориентирана **проектно базирана**, и че включва **чести тестове**. Освен това тази програма има обща **тема**, която й придава свързаност. +Избрахме два педагогически принципа при създаването на тази учебна програма: да бъде на практика **проектно-базирана** и да включва **чести тестове**. Освен това тази учебна програма има общ **тема**, която й придава цялостност. -Като осигуряваме, че съдържанието е свързано с проекти, процесът става по-ангажиращ за учениците и задържането на концепциите се увеличава. Освен това, ниско рисков тест преди урок задава цел на ученика към изучаването на темата, а втори тест след урок гарантира допълнително задържане. Тази учебна програма е проектирана да бъде гъвкава и забавна и може да се следва изцяло или частично. Проектите започват малки и стават все по-сложни към края на 12-седмичния цикъл. Тази програма включва и постскриптум за реални приложения на машинното обучение, който може да се използва като допълнителна точка или основа за дискусия. +Като гарантираме, че съдържанието съответства на проектите, процесът се прави по-ангажиращ за студентите и задържането на концепциите ще бъде увеличено. Освен това ниско рисков тест преди лекция задава намерението на студента към ученето на тема, докато втори тест след лекцията гарантира по-нататъшно запомняне. Тази учебна програма е проектирана да бъде гъвкава и забавна и може да се вземе изцяло или частично. Проектите започват малки и стават все по-сложни към края на 12-седмичния цикъл. Тази учебна програма включва и послеслов за приложения в реалния свят на машинното обучение, който може да се използва като допълнителен кредит или като основа за дискусия. -> Намерете нашите насоки [Правила за поведение](CODE_OF_CONDUCT.md), [Принос](CONTRIBUTING.md), [Преводи](..), и [Отстраняване на проблеми](TROUBLESHOOTING.md). Очакваме вашите конструктивни отзиви! +> Намерете нашия [Кодекс на поведение](CODE_OF_CONDUCT.md), [Указания за принос](CONTRIBUTING.md), [Преводи](..) и [Отстраняване на проблеми](TROUBLESHOOTING.md). Очакваме вашата конструктивна обратна връзка! ## Всеки урок включва - по желание скичнот - по желание допълнително видео -- видео увод (само при някои уроци) -- [тест преди лекцията](https://ff-quizzes.netlify.app/en/ml/) +- видео инструкция (само при някои уроци) +- [тест за загрявка преди лекцията](https://ff-quizzes.netlify.app/en/ml/) - писмен урок -- за проектно-базирани уроци, стъпка по стъпка инструкции за създаване на проекта +- при уроци, базирани на проекти, стъпка по стъпка указания за изграждане на проекта - проверки на знанията - предизвикателство - допълнително четиво - задача - [тест след лекцията](https://ff-quizzes.netlify.app/en/ml/) -> **Бележка относно езиците**: Тези уроци са основно написани на Python, но много от тях са налични и на R. За да завършите урок на R, отидете в папката `/solution` и потърсете уроци на R. Те включват разширение .rmd, което представлява **R Markdown** файл, който може просто да се дефинира като вграждане на `кодови сегменти` (на R или други езици) и `YAML заглавка` (която указва как да се форматират изходните данни като PDF) в `Markdown документ`. По този начин той служи като отлична рамка за създаване на материали за наука за данни, тъй като позволява да комбинирате кода си, неговия изход и вашите размисли, като ги записвате в Markdown. Освен това R Markdown документите могат да се рендерират в изходни формати като PDF, HTML или Word. - -> **Бележка относно тестовете**: Всички тестове са в [Папката на Quiz App](../../quiz-app), всичко 52 теста с по три въпроса всеки. Те са свързани от уроците, но quiz приложението може да се стартира локално; следвайте инструкциите в папката `quiz-app`, за да го хоствате локално или да го разположите в Azure. - -| Номер на урок | Тема | Групиране на урока | Цели на обучението | Свързан урок | Автор | -| :-----------: | :------------------------------------------------------------: | :-------------------------------------------------: | ------------------------------------------------------------------------------------------------------------------------------- | :--------------------------------------------------------------------------------------------------------------------------------------: | :--------------------------------------------------: | -| 01 | Въведение в машинното обучение | [Въведение](1-Introduction/README.md) | Научете основните понятия зад машинното обучение | [Урок](1-Introduction/1-intro-to-ML/README.md) | Мухамад | -| 02 | История на машинното обучение | [Въведение](1-Introduction/README.md) | Научете историята зад тази област | [Урок](1-Introduction/2-history-of-ML/README.md) | Джен и Ейми | -| 03 | Справедливост и машинно обучение | [Въведение](1-Introduction/README.md) | Какви са важните философски въпроси около справедливостта, които студентите трябва да имат предвид при създаване и прилагане на ML модели? | [Урок](1-Introduction/3-fairness/README.md) | Томоми | -| 04 | Техники за машинно обучение | [Въведение](1-Introduction/README.md) | Какви техники използват изследователите на ML за създаване на ML модели? | [Урок](1-Introduction/4-techniques-of-ML/README.md) | Крис и Джен | -| 05 | Въведение в регресията | [Регресия](2-Regression/README.md) | Започнете с Python и Scikit-learn за регресионни модели | [Python](2-Regression/1-Tools/README.md) • [R](../../2-Regression/1-Tools/solution/R/lesson_1.html) | Джен • Ерик Уанджау | -| 06 | Цени на тиквите в Северна Америка 🎃 | [Регресия](2-Regression/README.md) | Визуализирайте и почистете данни в подготовка за ML | [Python](2-Regression/2-Data/README.md) • [R](../../2-Regression/2-Data/solution/R/lesson_2.html) | Джен • Ерик Уанджау | -| 07 | Цени на тиквите в Северна Америка 🎃 | [Регресия](2-Regression/README.md) | Създайте линейни и полиномиални регресионни модели | [Python](2-Regression/3-Linear/README.md) • [R](../../2-Regression/3-Linear/solution/R/lesson_3.html) | Джен и Дмитрий • Ерик Уанджау | -| 08 | Цени на тиквите в Северна Америка 🎃 | [Регресия](2-Regression/README.md) | Създайте логистичен регресионен модел | [Python](2-Regression/4-Logistic/README.md) • [R](../../2-Regression/4-Logistic/solution/R/lesson_4.html) | Джен • Ерик Уанджау | -| 09 | Уеб приложение 🔌 | [Уеб приложение](3-Web-App/README.md) | Създайте уеб приложение, за да използвате обучената си модел | [Python](3-Web-App/1-Web-App/README.md) | Джен | -| 10 | Въведение в класификацията | [Класификация](4-Classification/README.md) | Почистете, подгответе и визуализирайте данните си; въведение в класификация | [Python](4-Classification/1-Introduction/README.md) • [R](../../4-Classification/1-Introduction/solution/R/lesson_10.html) | Джен и Каси • Ерик Уанджау | -| 11 | Вкусна азиатска и индийска кухня 🍜 | [Класификация](4-Classification/README.md) | Въведение в класификатори | [Python](4-Classification/2-Classifiers-1/README.md) • [R](../../4-Classification/2-Classifiers-1/solution/R/lesson_11.html) | Джен и Каси • Ерик Уанджау | -| 12 | Вкусна азиатска и индийска кухня 🍜 | [Класификация](4-Classification/README.md) | Още класификатори | [Python](4-Classification/3-Classifiers-2/README.md) • [R](../../4-Classification/3-Classifiers-2/solution/R/lesson_12.html) | Джен и Каси • Ерик Уанджау | -| 13 | Вкусна азиатска и индийска кухня 🍜 | [Класификация](4-Classification/README.md) | Създайте препоръчващо уеб приложение, използвайки вашия модел | [Python](4-Classification/4-Applied/README.md) | Джен | -| 14 | Въведение в клъстерирането | [Клъстериране](5-Clustering/README.md) | Почистете, подгответе и визуализирайте данните си; въведение в клъстериране | [Python](5-Clustering/1-Visualize/README.md) • [R](../../5-Clustering/1-Visualize/solution/R/lesson_14.html) | Джен • Ерик Уанджау | -| 15 | Изследване на музикалните вкусове в Нигерия 🎧 | [Клъстериране](5-Clustering/README.md) | Изследвайте метода на K-средни | [Python](5-Clustering/2-K-Means/README.md) • [R](../../5-Clustering/2-K-Means/solution/R/lesson_15.html) | Джен • Ерик Уанджау | -| 16 | Въведение в обработката на естествен език ☕️ | [Обработка на естествен език](6-NLP/README.md) | Научете основите на NLP чрез създаване на прост бот | [Python](6-NLP/1-Introduction-to-NLP/README.md) | Стивън | -| 17 | Често срещани задачи в NLP ☕️ | [Обработка на естествен език](6-NLP/README.md) | Задълбочете знанията си за NLP, като разберете често срещаните задачи при работа с езикови структури | [Python](6-NLP/2-Tasks/README.md) | Стивън | -| 18 | Превод и анализ на настроения ♥️ | [Обработка на естествен език](6-NLP/README.md) | Превод и анализ на настроения с Джейн Остин | [Python](6-NLP/3-Translation-Sentiment/README.md) | Стивън | -| 19 | Романтични хотели в Европа ♥️ | [Обработка на естествен език](6-NLP/README.md) | Анализ на настроения с рецензии за хотели 1 | [Python](6-NLP/4-Hotel-Reviews-1/README.md) | Стивън | -| 20 | Романтични хотели в Европа ♥️ | [Обработка на естествен език](6-NLP/README.md) | Анализ на настроения с рецензии за хотели 2 | [Python](6-NLP/5-Hotel-Reviews-2/README.md) | Стивън | -| 21 | Въведение в прогнозирането на времеви редове | [Времеви редове](7-TimeSeries/README.md) | Въведение в прогнозиране на времеви редове | [Python](7-TimeSeries/1-Introduction/README.md) | Франческа | -| 22 | ⚡️ Световна консумация на електроенергия ⚡️ - прогнозиране с ARIMA | [Времеви редове](7-TimeSeries/README.md) | Прогнозиране на времеви редове с ARIMA | [Python](7-TimeSeries/2-ARIMA/README.md) | Франческа | -| 23 | ⚡️ Световна консумация на електроенергия ⚡️ - прогнозиране с SVR | [Времеви редове](7-TimeSeries/README.md) | Прогнозиране на времеви редове с регресор с опорни вектори | [Python](7-TimeSeries/3-SVR/README.md) | Анирбан | -| 24 | Въведение в подсилващото обучение | [Подсилващо обучение](8-Reinforcement/README.md) | Въведение в подсилващото обучение с Q-обучение | [Python](8-Reinforcement/1-QLearning/README.md) | Дмитрий | -| 25 | Помогнете на Питър да избегне вълка! 🐺 | [Подсилващо обучение](8-Reinforcement/README.md) | Подсилващо обучение Gym | [Python](8-Reinforcement/2-Gym/README.md) | Дмитрий | -| Поука | Приложения и сценарии на ML в реалния свят | [ML в дивата природа](9-Real-World/README.md) | Интересни и разкриващи приложения на класическо ML в реални ситуации | [Урок](9-Real-World/1-Applications/README.md) | Екип | -| Поука | Отстраняване на грешки в ML с помощта на RAI таблото | [ML в дивата природа](9-Real-World/README.md) | Отстраняване на грешки в машинното обучение с компоненти на таблото за Отговорен AI | [Урок](9-Real-World/2-Debugging-ML-Models/README.md) | Рут Якубу | - -> [намерете всички допълнителни ресурси за този курс в нашата колекция Microsoft Learn](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) - -## Офлайн достъп - -Можете да стартирате тази документация офлайн, като използвате [Docsify](https://docsify.js.org/#/). Форкнете това хранилище, [инсталирайте Docsify](https://docsify.js.org/#/quickstart) на локалната си машина и след това в главната папка на това хранилище напишете `docsify serve`. Уебсайтът ще бъде обслужван на порт 3000 на localhost: `localhost:3000`. +> **Бележка относно езиците**: Тези уроци са основно написани на Python, но много от тях са достъпни и на R. За да завършите урок на R, отидете в папката `/solution` и потърсете уроци на R. Те включват разширение .rmd, което представлява **R Markdown** файл, който може да се дефинира просто като вграждане на `code chunks` (на R или други езици) и `YAML header` (който ръководи как да се форматират изходните данни като PDF) в `Markdown документ`. Като такъв, той служи като примерна рамка за авторство за науката за данните, тъй като позволява да комбинирате кода си, изхода му и своите мисли, като ги записвате в Markdown. Освен това, R Markdown документите могат да бъдат изведени във формати като PDF, HTML или Word. + +> **Бележка относно тестовете**: Всички тестове се съдържат в [папката Quiz App](../../quiz-app), общо 52 теста с по три въпроса всеки. Те са свързани от уроците, но приложението за тестове може да се стартира локално; следвайте инструкциите в папката `quiz-app`, за да хоствате локално или да деплойнете в Azure. + +| Номер на урок | Тема | Групиране на уроци | Учебни цели | Свързан урок | Автор | +| :-----------: | :------------------------------------------------------------: | :-----------------------------------------------------: | ----------------------------------------------------------------------------------------------------------------------------- | :--------------------------------------------------------------------------------------------------------------------------------------: | :--------------------------------------------------: | +| 01 | Въведение към машинното обучение | [Въведение](1-Introduction/README.md) | Научете основните концепции зад машинното обучение | [Урок](1-Introduction/1-intro-to-ML/README.md) | Мухаммад | +| 02 | История на машинното обучение | [Въведение](1-Introduction/README.md) | Научете историята, която стои зад тази област | [Урок](1-Introduction/2-history-of-ML/README.md) | Джен и Ейми | +| 03 | Справедливост и машинно обучение | [Въведение](1-Introduction/README.md) | Какви са важните философски въпроси около справедливостта, които студентите трябва да разгледат при създаване и прилагане на МЛ? | [Урок](1-Introduction/3-fairness/README.md) | Томоми | +| 04 | Техники за машинно обучение | [Въведение](1-Introduction/README.md) | Какви техники използват изследователите на МЛ за създаване на модели? | [Урок](1-Introduction/4-techniques-of-ML/README.md) | Крис и Джен | +| 05 | Въведение в регресията | [Регресия](2-Regression/README.md) | Започнете с Python и Scikit-learn за регресионни модели | [Python](2-Regression/1-Tools/README.md) • [R](../../2-Regression/1-Tools/solution/R/lesson_1.html) | Джен • Ерик Уанджу | +| 06 | Цени на тикви в Северна Америка 🎃 | [Регресия](2-Regression/README.md) | Визуализиране и почистване на данни в подготовка за МЛ | [Python](2-Regression/2-Data/README.md) • [R](../../2-Regression/2-Data/solution/R/lesson_2.html) | Джен • Ерик Уанджу | +| 07 | Цени на тикви в Северна Америка 🎃 | [Регресия](2-Regression/README.md) | Създаване на линейни и полиномиални регресионни модели | [Python](2-Regression/3-Linear/README.md) • [R](../../2-Regression/3-Linear/solution/R/lesson_3.html) | Джен и Дмитрий • Ерик Уанджу | +| 08 | Цени на тикви в Северна Америка 🎃 | [Регресия](2-Regression/README.md) | Създаване на логистичен регресионен модел | [Python](2-Regression/4-Logistic/README.md) • [R](../../2-Regression/4-Logistic/solution/R/lesson_4.html) | Джен • Ерик Уанджу | +| 09 | Уеб приложение 🔌 | [Уеб приложение](3-Web-App/README.md) | Създаване на уеб приложение за използване на обучен модел | [Python](3-Web-App/1-Web-App/README.md) | Джен | +| 10 | Въведение в класификацията | [Класификация](4-Classification/README.md) | Почистете, подгответе и визуализирайте данните си; въведение в класификация | [Python](4-Classification/1-Introduction/README.md) • [R](../../4-Classification/1-Introduction/solution/R/lesson_10.html) | Джен и Каси • Ерик Уанджу | +| 11 | Вкусна азиатска и индийска кухня 🍜 | [Класификация](4-Classification/README.md) | Въведение в класификаторите | [Python](4-Classification/2-Classifiers-1/README.md) • [R](../../4-Classification/2-Classifiers-1/solution/R/lesson_11.html) | Джен и Каси • Ерик Уанджу | +| 12 | Вкусна азиатска и индийска кухня 🍜 | [Класификация](4-Classification/README.md) | Още класификатори | [Python](4-Classification/3-Classifiers-2/README.md) • [R](../../4-Classification/3-Classifiers-2/solution/R/lesson_12.html) | Джен и Каси • Ерик Уанджу | +| 13 | Вкусна азиатска и индийска кухня 🍜 | [Класификация](4-Classification/README.md) | Създаване на уеб приложение за препоръки, използвайки вашия модел | [Python](4-Classification/4-Applied/README.md) | Джен | +| 14 | Въведение в клъстеризацията | [Клъстеризация](5-Clustering/README.md) | Почистете, подгответе и визуализирайте данните си; въведение в клъстеризация | [Python](5-Clustering/1-Visualize/README.md) • [R](../../5-Clustering/1-Visualize/solution/R/lesson_14.html) | Джен • Ерик Уанджу | +| 15 | Изследване на музикалните вкусове в Нигерия 🎧 | [Клъстеризация](5-Clustering/README.md) | Изследване на метода K-Means клъстеризация | [Python](5-Clustering/2-K-Means/README.md) • [R](../../5-Clustering/2-K-Means/solution/R/lesson_15.html) | Джен • Ерик Уанджу | +| 16 | Въведение в обработката на естествен език ☕️ | [Обработка на естествен език](6-NLP/README.md) | Научете основите за NLP чрез създаване на прост бот | [Python](6-NLP/1-Introduction-to-NLP/README.md) | Стивън | +| 17 | Чести задачи в NLP ☕️ | [Обработка на естествен език](6-NLP/README.md) | Задълбочете знанията си в NLP чрез разбиране на често срещаните задачи при работа с езикови структури | [Python](6-NLP/2-Tasks/README.md) | Стивън | +| 18 | Превод и анализ на настроения ♥️ | [Обработка на естествен език](6-NLP/README.md) | Превод и анализ на настроения с Джейн Остин | [Python](6-NLP/3-Translation-Sentiment/README.md) | Стивън | +| 19 | Романтични хотели в Европа ♥️ | [Обработка на естествен език](6-NLP/README.md) | Анализ на настроения с ревюта на хотели 1 | [Python](6-NLP/4-Hotel-Reviews-1/README.md) | Стивън | +| 20 | Романтични хотели в Европа ♥️ | [Обработка на естествен език](6-NLP/README.md) | Анализ на настроения с ревюта на хотели 2 | [Python](6-NLP/5-Hotel-Reviews-2/README.md) | Стивън | +| 21 | Въведение в прогнозиране на времеви серии | [Времеви серии](7-TimeSeries/README.md) | Въведение в прогнозиране на времеви серии | [Python](7-TimeSeries/1-Introduction/README.md) | Франческа | +| 22 | ⚡️ Световна консумация на електроенергия ⚡️ - прогнозиране с ARIMA | [Времеви серии](7-TimeSeries/README.md) | Прогнозиране на времеви серии с ARIMA | [Python](7-TimeSeries/2-ARIMA/README.md) | Франческа | +| 23 | ⚡️ Световна консумация на електроенергия ⚡️ - прогнозиране с SVR | [Времеви серии](7-TimeSeries/README.md) | Прогнозиране на времеви серии с Support Vector Regressor | [Python](7-TimeSeries/3-SVR/README.md) | Анирбан | +| 24 | Въведение в обучение с подсилване | [Обучение с подсилване](8-Reinforcement/README.md) | Въведение в обучение с подсилване с Q-Learning | [Python](8-Reinforcement/1-QLearning/README.md) | Дмитрий | +| 25 | Помогнете на Питър да избегне вълка! 🐺 | [Обучение с подсилване](8-Reinforcement/README.md) | Обучение с подсилване в Gym | [Python](8-Reinforcement/2-Gym/README.md) | Дмитрий | +| Постскрипт | Реални сценарии и приложения на МЛ | [МЛ в дивата природа](9-Real-World/README.md) | Интересни и показателни реални приложения на класическото МЛ | [Урок](9-Real-World/1-Applications/README.md) | Отбор | +| Постскрипт | Отстраняване на грешки в модели на МЛ с помощта на RAI | [МЛ в дивата природа](9-Real-World/README.md) | Отстраняване на грешки в машинното обучение с помощта на компоненти от таблото на Responsible AI | [Урок](9-Real-World/2-Debugging-ML-Models/README.md) | Рут Якубу | + +> [намерете всички допълнителни ресурси за този курс в нашата Microsoft Learn колекция](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) + +## Достъп офлайн + +Можете да използвате тази документация офлайн чрез [Docsify](https://docsify.js.org/#/). Форкнете това репо, [инсталирайте Docsify](https://docsify.js.org/#/quickstart) на вашия локален компютър и след това в коренната папка на това репо въведете `docsify serve`. Уебсайтът ще се стартира на порт 3000 на вашия localhost: `localhost:3000`. ## PDF файлове -Намерете PDF на учебната програма с линкове [тук](https://microsoft.github.io/ML-For-Beginners/pdf/readme.pdf). - +Намерете pdf на учебния план с връзки [тук](https://microsoft.github.io/ML-For-Beginners/pdf/readme.pdf). -## 🎒 Други курсове +## 🎒 Други курсове -Нашият екип създава и други курсове! Вижте: +Нашият екип произвежда и други курсове! Вижте: ### LangChain @@ -186,53 +185,64 @@ Cloud Advocates в Microsoft с радост предлагат 12-седмич [![AZD за начинаещи](https://img.shields.io/badge/AZD%20for%20Beginners-0078D4?style=for-the-badge&labelColor=E5E7EB&color=0078D4)](https://github.com/microsoft/AZD-for-beginners?WT.mc_id=academic-105485-koreyst) [![Edge AI за начинаещи](https://img.shields.io/badge/Edge%20AI%20for%20Beginners-00B8E4?style=for-the-badge&labelColor=E5E7EB&color=00B8E4)](https://github.com/microsoft/edgeai-for-beginners?WT.mc_id=academic-105485-koreyst) [![MCP за начинаещи](https://img.shields.io/badge/MCP%20for%20Beginners-009688?style=for-the-badge&labelColor=E5E7EB&color=009688)](https://github.com/microsoft/mcp-for-beginners?WT.mc_id=academic-105485-koreyst) -[![AI Агенти за начинаещи](https://img.shields.io/badge/AI%20Agents%20for%20Beginners-00C49A?style=for-the-badge&labelColor=E5E7EB&color=00C49A)](https://github.com/microsoft/ai-agents-for-beginners?WT.mc_id=academic-105485-koreyst) +[![AI агенти за начинаещи](https://img.shields.io/badge/AI%20Agents%20for%20Beginners-00C49A?style=for-the-badge&labelColor=E5E7EB&color=00C49A)](https://github.com/microsoft/ai-agents-for-beginners?WT.mc_id=academic-105485-koreyst) --- -### Серия за генеративен ИИ -[![Генеративен ИИ за начинаещи](https://img.shields.io/badge/Generative%20AI%20for%20Beginners-8B5CF6?style=for-the-badge&labelColor=E5E7EB&color=8B5CF6)](https://github.com/microsoft/generative-ai-for-beginners?WT.mc_id=academic-105485-koreyst) -[![Генеративен ИИ (.NET)](https://img.shields.io/badge/Generative%20AI%20(.NET)-9333EA?style=for-the-badge&labelColor=E5E7EB&color=9333EA)](https://github.com/microsoft/Generative-AI-for-beginners-dotnet?WT.mc_id=academic-105485-koreyst) -[![Генеративен ИИ (Java)](https://img.shields.io/badge/Generative%20AI%20(Java)-C084FC?style=for-the-badge&labelColor=E5E7EB&color=C084FC)](https://github.com/microsoft/generative-ai-for-beginners-java?WT.mc_id=academic-105485-koreyst) -[![Генеративен ИИ (JavaScript)](https://img.shields.io/badge/Generative%20AI%20(JavaScript)-E879F9?style=for-the-badge&labelColor=E5E7EB&color=E879F9)](https://github.com/microsoft/generative-ai-with-javascript?WT.mc_id=academic-105485-koreyst) +### Серия за генеративен AI +[![Генеративен AI за начинаещи](https://img.shields.io/badge/Generative%20AI%20for%20Beginners-8B5CF6?style=for-the-badge&labelColor=E5E7EB&color=8B5CF6)](https://github.com/microsoft/generative-ai-for-beginners?WT.mc_id=academic-105485-koreyst) +[![Генеративен AI (.NET)](https://img.shields.io/badge/Generative%20AI%20(.NET)-9333EA?style=for-the-badge&labelColor=E5E7EB&color=9333EA)](https://github.com/microsoft/Generative-AI-for-beginners-dotnet?WT.mc_id=academic-105485-koreyst) +[![Генеративен AI (Java)](https://img.shields.io/badge/Generative%20AI%20(Java)-C084FC?style=for-the-badge&labelColor=E5E7EB&color=C084FC)](https://github.com/microsoft/generative-ai-for-beginners-java?WT.mc_id=academic-105485-koreyst) +[![Генеративен AI (JavaScript)](https://img.shields.io/badge/Generative%20AI%20(JavaScript)-E879F9?style=for-the-badge&labelColor=E5E7EB&color=E879F9)](https://github.com/microsoft/generative-ai-with-javascript?WT.mc_id=academic-105485-koreyst) --- ### Основно обучение [![Машинно обучение за начинаещи](https://img.shields.io/badge/ML%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=22C55E)](https://aka.ms/ml-beginners?WT.mc_id=academic-105485-koreyst) -[![Наука за данни за начинаещи](https://img.shields.io/badge/Data%20Science%20for%20Beginners-84CC16?style=for-the-badge&labelColor=E5E7EB&color=84CC16)](https://aka.ms/datascience-beginners?WT.mc_id=academic-105485-koreyst) -[![ИИ за начинаещи](https://img.shields.io/badge/AI%20for%20Beginners-A3E635?style=for-the-badge&labelColor=E5E7EB&color=A3E635)](https://aka.ms/ai-beginners?WT.mc_id=academic-105485-koreyst) +[![Наука за данните за начинаещи](https://img.shields.io/badge/Data%20Science%20for%20Beginners-84CC16?style=for-the-badge&labelColor=E5E7EB&color=84CC16)](https://aka.ms/datascience-beginners?WT.mc_id=academic-105485-koreyst) +[![AI за начинаещи](https://img.shields.io/badge/AI%20for%20Beginners-A3E635?style=for-the-badge&labelColor=E5E7EB&color=A3E635)](https://aka.ms/ai-beginners?WT.mc_id=academic-105485-koreyst) [![Киберсигурност за начинаещи](https://img.shields.io/badge/Cybersecurity%20for%20Beginners-F97316?style=for-the-badge&labelColor=E5E7EB&color=F97316)](https://github.com/microsoft/Security-101?WT.mc_id=academic-96948-sayoung) [![Уеб разработка за начинаещи](https://img.shields.io/badge/Web%20Dev%20for%20Beginners-EC4899?style=for-the-badge&labelColor=E5E7EB&color=EC4899)](https://aka.ms/webdev-beginners?WT.mc_id=academic-105485-koreyst) -[![Интернет на нещата за начинаещи](https://img.shields.io/badge/IoT%20for%20Beginners-14B8A6?style=for-the-badge&labelColor=E5E7EB&color=14B8A6)](https://aka.ms/iot-beginners?WT.mc_id=academic-105485-koreyst) +[![IoT за начинаещи](https://img.shields.io/badge/IoT%20for%20Beginners-14B8A6?style=for-the-badge&labelColor=E5E7EB&color=14B8A6)](https://aka.ms/iot-beginners?WT.mc_id=academic-105485-koreyst) [![XR разработка за начинаещи](https://img.shields.io/badge/XR%20Development%20for%20Beginners-38BDF8?style=for-the-badge&labelColor=E5E7EB&color=38BDF8)](https://github.com/microsoft/xr-development-for-beginners?WT.mc_id=academic-105485-koreyst) --- -### Серия Copilot -[![Copilot за двойно програмиране с ИИ](https://img.shields.io/badge/Copilot%20for%20AI%20Paired%20Programming-FACC15?style=for-the-badge&labelColor=E5E7EB&color=FACC15)](https://aka.ms/GitHubCopilotAI?WT.mc_id=academic-105485-koreyst) +### Серия за Copilot +[![Copilot за съвместно програмиране с AI](https://img.shields.io/badge/Copilot%20for%20AI%20Paired%20Programming-FACC15?style=for-the-badge&labelColor=E5E7EB&color=FACC15)](https://aka.ms/GitHubCopilotAI?WT.mc_id=academic-105485-koreyst) [![Copilot за C#/.NET](https://img.shields.io/badge/Copilot%20for%20C%23/.NET-FBBF24?style=for-the-badge&labelColor=E5E7EB&color=FBBF24)](https://github.com/microsoft/mastering-github-copilot-for-dotnet-csharp-developers?WT.mc_id=academic-105485-koreyst) -[![Copilot Приключение](https://img.shields.io/badge/Copilot%20Adventure-FDE68A?style=for-the-badge&labelColor=E5E7EB&color=FDE68A)](https://github.com/microsoft/CopilotAdventures?WT.mc_id=academic-105485-koreyst) +[![Copilot приключение](https://img.shields.io/badge/Copilot%20Adventure-FDE68A?style=for-the-badge&labelColor=E5E7EB&color=FDE68A)](https://github.com/microsoft/CopilotAdventures?WT.mc_id=academic-105485-koreyst) ## Получаване на помощ -Ако заседнете или имате въпроси относно създаването на приложения с ИИ. Присъединете се към други учащи се и опитни разработчици в дискусии за MCP. Това е подкрепяща общност, където въпросите са добре дошли и знанието се споделя свободно. +Ако се затрудните или имате въпроси, докато учите Машинно обучение или разработвате AI приложения, не се притеснявайте — помощта е на разположение. -[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG) +Можете да се включите в дискусии с други учащи и разработчици, да задавате въпроси и да споделяте идеи с общността. + +- Присъединете се към общността, за да задавате въпроси и да учите с други +- Обсъждайте концепции за Машинно обучение и идеи за проекти +- Получавайте насоки от опитни разработчици + +Поддържаща общност е отличен начин да развиете уменията си и да решавате проблеми по-бързо. -Ако имате обратна връзка за продукт или грешки при създаването посетете: +[Microsoft Foundry Discord Community](https://discord.gg/nTYy5BXMWG) + +Ако срещнете грешки, бъгове или имате предложения за подобрения, можете да отворите **Issue** в това хранилище, за да докладвате проблема. + +За обратна връзка относно продукта или за търсене на вече публикувани теми в общността, посетете Форума на разработчиците: [![Microsoft Foundry Developer Forum](https://img.shields.io/badge/GitHub-Microsoft_Foundry_Developer_Forum-blue?style=for-the-badge&logo=github&color=000000&logoColor=fff)](https://aka.ms/foundry/forum) -## Допълнителни съвети за обучение -- Преглеждайте тетрадки след всеки урок за по-добро разбиране. +## Допълнителни съвети за учене + +- Преглеждайте бележниците след всеки урок за по-добро разбиране. - Практикувайте прилагането на алгоритми самостоятелно. -- Изследвайте реални набори от данни, използвайки научените концепции. +- Изследвайте реални набори от данни с помощта на научените концепции. --- **Отказ от отговорност**: -Този документ е преведен с помощта на AI преводаческа услуга [Co-op Translator](https://github.com/Azure/co-op-translator). Въпреки че се стремим към точност, имайте предвид, че автоматизираните преводи могат да съдържат грешки или неточности. Оригиналният документ на неговия роден език трябва да се счита за авторитетен източник. За критична информация се препоръчва професионален човешки превод. Ние не носим отговорност за каквито и да било недоразумения или погрешни тълкувания, произтичащи от използването на този превод. +Този документ е преведен с помощта на AI преводаческа услуга [Co-op Translator](https://github.com/Azure/co-op-translator). Въпреки че се стремим към точност, моля, имайте предвид, че автоматизираните преводи могат да съдържат грешки или неточности. Оригиналният документ на неговия роден език трябва да се счита за авторитетен източник. За критична информация се препоръчва професионален човешки превод. Ние не носим отговорност за каквито и да е недоразумения или неверни тълкувания, произтичащи от използването на този превод. \ No newline at end of file diff --git a/translations/ro/.co-op-translator.json b/translations/ro/.co-op-translator.json index 5a1edc424..48a469ef3 100644 --- a/translations/ro/.co-op-translator.json +++ b/translations/ro/.co-op-translator.json @@ -90,8 +90,8 @@ "language_code": "ro" }, "2-Regression/3-Linear/README.md": { - "original_hash": "9a8359f1945bd3beccccb2b46592580e", - "translation_date": "2026-02-28T10:22:58+00:00", + "original_hash": "26c53a922f1f1e8542b0ea41ff52221a", + "translation_date": "2026-04-20T20:36:50+00:00", "source_file": "2-Regression/3-Linear/README.md", "language_code": "ro" }, @@ -168,8 +168,8 @@ "language_code": "ro" }, "4-Classification/2-Classifiers-1/README.md": { - "original_hash": "1a6e9e46b34a2e559fbbfc1f95397c7b", - "translation_date": "2025-09-05T16:19:16+00:00", + "original_hash": "cb761595e5b6c42b99bb81bd13683311", + "translation_date": "2026-04-20T20:37:43+00:00", "source_file": "4-Classification/2-Classifiers-1/README.md", "language_code": "ro" }, @@ -552,8 +552,8 @@ "language_code": "ro" }, "README.md": { - "original_hash": "7fb48097f57e680b380cd9aae988d317", - "translation_date": "2026-04-06T17:20:21+00:00", + "original_hash": "3e3a6c7e68e0afe7e2276ac046e4d7a0", + "translation_date": "2026-04-20T20:35:22+00:00", "source_file": "README.md", "language_code": "ro" }, diff --git a/translations/ro/2-Regression/3-Linear/README.md b/translations/ro/2-Regression/3-Linear/README.md index 0ac1dda68..f87430743 100644 --- a/translations/ro/2-Regression/3-Linear/README.md +++ b/translations/ro/2-Regression/3-Linear/README.md @@ -1,136 +1,136 @@ -# Construiește un model de regresie folosind Scikit-learn: patru moduri de regresie +# Construiește un model de regresie folosind Scikit-learn: regresie în patru moduri ## Notă pentru începători Regresia liniară este folosită atunci când dorim să prezicem o **valoare numerică** (de exemplu, prețul unei case, temperatura sau vânzările). Funcționează prin găsirea unei linii drepte care reprezintă cel mai bine relația dintre caracteristicile de intrare și ieșire. -În această lecție, ne concentrăm pe înțelegerea conceptului înainte de a explora tehnici mai avansate de regresie. -![Infografic regresie liniară vs polinomială](../../../../translated_images/ro/linear-polynomial.5523c7cb6576ccab.webp) -> Infografic realizat de [Dasani Madipalli](https://twitter.com/dasani_decoded) +În această lecție, ne concentrăm pe înțelegerea conceptului înainte de a explora tehnici de regresie mai avansate. +![Linear vs polynomial regression infographic](../../../../translated_images/ro/linear-polynomial.5523c7cb6576ccab.webp) +> Infografic de [Dasani Madipalli](https://twitter.com/dasani_decoded) ## [Test pre-lectură](https://ff-quizzes.netlify.app/en/ml/) -> ### [Această lecție este disponibilă și în R!](../../../../2-Regression/3-Linear/solution/R/lesson_3.html) +> ### [Această lecție este disponibilă în R!](../../../../2-Regression/3-Linear/solution/R/lesson_3.html) ### Introducere -Până acum ai explorat ce este regresia cu date de probă culese din setul de date despre prețurile dovlecilor pe care îl vom folosi pe parcursul acestei lecții. De asemenea, ai vizualizat datele folosind Matplotlib. +Până acum ați explorat ce este regresia cu date de probă adunate din setul de date despre prețurile dovlecilor pe care îl vom folosi pe parcursul acestei lecții. De asemenea, ați vizualizat datele folosind Matplotlib. -Acum ești pregătit să aprofundezi regresia pentru Învățare Automată. În timp ce vizualizarea îți permite să înțelegi datele, adevărata putere a Învățării Automate provine din _antrenarea modelelor_. Modelele sunt antrenate pe date istorice pentru a captura automat dependențele din date și îți permit să prevezi rezultate pentru date noi, pe care modelul nu le-a văzut înainte. +Acum sunteți gata să aprofundați regresia pentru învățarea automată (ML). Deși vizualizarea permite să înțelegeți datele, adevărata putere a învățării automate vine din _antrenarea modelelor_. Modelele sunt antrenate pe date istorice pentru a captura automat dependențele din date și vă permit să preziceți rezultate pentru date noi, pe care modelul nu le-a văzut anterior. -În această lecție, vei învăța mai multe despre două tipuri de regresie: _regresia liniară de bază_ și _regresia polinomială_, alături de unele aspecte matematice care stau la baza acestor tehnici. Aceste modele ne vor permite să prezicem prețurile dovlecilor în funcție de diferite date de intrare. +În această lecție veți învăța mai multe despre două tipuri de regresie: _regresie liniară de bază_ și _regresie polinomială_, împreună cu unele dintre elementele matematice ale acestor tehnici. Aceste modele ne vor permite să prezicem prețurile dovlecilor în funcție de diferite date de intrare. -[![ML pentru începători - Înțelegerea regresiei liniare](https://img.youtube.com/vi/CRxFT8oTDMg/0.jpg)](https://youtu.be/CRxFT8oTDMg "ML pentru începători - Înțelegerea regresiei liniare") +[![ML for beginners - Understanding Linear Regression](https://img.youtube.com/vi/CRxFT8oTDMg/0.jpg)](https://youtu.be/CRxFT8oTDMg "ML for beginners - Understanding Linear Regression") -> 🎥 Dă click pe imaginea de mai sus pentru un scurt videoclip despre regresia liniară. +> 🎥 Faceți click pe imaginea de mai sus pentru un scurt videoclip introductiv despre regresia liniară. -> Pe tot parcursul acestui curriculum, presupunem un minim de cunoștințe matematice și încercăm să îl facem accesibil pentru studenți din alte domenii, așa că fii atent la note, 🧮 explicații, diagrame și alte instrumente de învățare care te vor ajuta să înțelegi. +> Pe tot parcursul acestui curriculum, presupunem cunoștințe minime de matematică și ne propunem să o facem accesibilă pentru studenți din alte domenii, așa că urmăriți notele, 🧮 apelurile, diagramele și alte unelte de învățare pentru a ajuta la înțelegere. -### Pregătire prealabilă +### Cerință prealabilă -Ar trebui să fii familiarizat până acum cu structura datelor despre dovleci pe care le examinăm. Le poți găsi preîncărcate și prelucrate în fișierul _notebook.ipynb_ al acestei lecții. În fișier, prețul dovlecilor este afișat pe bushel într-un nou tabel de date. Asigură-te că poți rula aceste jurnale în kernel-uri din Visual Studio Code. +Ar trebui să fiți familiarizați până acum cu structura datelor despre dovleci pe care le examinăm. Le puteți găsi preîncărcate și preprocesate în fișierul _notebook.ipynb_ al acestei lecții. În fișier, prețul dovlecilor este afișat pe bushel într-un nou DataFrame. Asigurați-vă că puteți rula aceste noteboooks în kerneluri din Visual Studio Code. ### Pregătire -Ca o reamintire, încarci aceste date pentru a putea pune întrebări despre ele. +Ca un memento, încărcați aceste date pentru a putea pune întrebări despre ele. -- Care este cel mai bun moment pentru a cumpăra dovleci? -- Ce preț pot să mă aștept pentru o cutie de dovleci miniatură? -- Ar trebui să îi cumpăr în coșuri de jumătate de bushel sau în cutii de 1 1/9 busheli? -Hai să continuăm să explorăm aceste date. +- Când este cel mai bun moment pentru a cumpăra dovleci? +- Ce preț pot să aștept pentru un coș de dovleci miniatură? +- Ar trebui să îi cumpăr în coșuri de jumătate de bushel sau în cutii de 1 1/9 bushel? +Să continuăm să explorăm aceste date. -În lecția anterioară, ai creat un tabel Pandas și l-ai populat cu o parte din setul original de date, standardizând prețul pe bushel. Prin această metodă, însă, ai reușit să aduni doar aproximativ 400 de puncte de date și doar pentru lunile de toamnă. +În lecția anterioară, ați creat un DataFrame Pandas și l-ați populat cu o parte din setul original de date, standardizând prețurile pe bushel. Prin aceasta, totuși, ați putut colecta doar aproximativ 400 de puncte de date și numai pentru lunile de toamnă. -Aruncă o privire la datele preîncărcate în jurnalul însoțitor al acestei lecții. Datele sunt preîncărcate și este reprezentat un grafic dispersie (scatterplot) inițial pentru a arăta datele pe lună. Poate putem să aflăm mai multe detalii despre natura datelor curățându-le mai mult. +Aruncați o privire la datele pe care le-am preîncărcat în notebook-ul însoțitor al acestei lecții. Datele sunt preîncărcate și este afișat un grafic de dispersie inițial pentru a arăta datele pe lună. Poate putem obține mai multe detalii despre natura datelor dacă le curățăm mai bine. ## O linie de regresie liniară -După cum ai învățat în Lecția 1, scopul exercițiului de regresie liniară este să putem trasa o linie pentru a: +După cum ați învățat în Lecția 1, scopul unui exercițiu de regresie liniară este să puteți trasa o linie care să: -- **Arăta relațiile dintre variabile**. Arată relația dintre variabile -- **Face predicții**. Face predicții precise privind unde ar cădea un nou punct de date în raport cu acea linie. +- **Arate relațiile variabilelor**. Să arate relația dintre variabile +- **Facă predicții**. Să facă predicții precise despre unde ar cădea un nou punct de date în raport cu acea linie. -Este tipic pentru **regresia celor mai mici pătrate** să traseze acest tip de linie. Termenul „Cei mai mici pătrați” se referă la procesul de minimizare a erorii totale din modelul nostru. Pentru fiecare punct de date, măsurăm distanța verticală (numită reziduală) între punctul real și linia de regresie. +Este tipic pentru **Regresia celor mai mici pătrate (Least-Squares Regression)** să traseze acest tip de linie. Termenul „Cei mai mici pătrate” se referă la procesul de minimizare a erorii totale în modelul nostru. Pentru fiecare punct de date, măsurăm distanța verticală (numită reziduală) între punctul real și linia noastră de regresie. -Aceste distanțe le ridicăm la pătrat din două motive principale: +Aceste distanțe le pătrățim din două motive principale: -1. **Magnitudine, nu Direcție:** Dorim să tratăm o eroare de -5 la fel ca o eroare de +5. Ridicarea la pătrat transformă toate valorile în pozitive. +1. **Magnitudine în loc de Direcție:** Dorim să tratăm o eroare de -5 la fel ca o eroare de +5. Pătratul transformă toate valorile în pozitive. -2. **Penalizarea valorilor extreme:** Ridicarea la pătrat atribuie o greutate mai mare erorilor mari, forțând linia să fie mai aproape de punctele care sunt mai îndepărtate. +2. **Penalizarea valorilor aberante:** Pătratul dă o greutate mai mare erorilor mari, forțând linia să rămână mai aproape de punctele care sunt departe. -Apoi adunăm toate aceste valori ridicate la pătrat. Scopul nostru este să găsim linia specifică pentru care această sumă finală este cea mai mică (valoarea posibilă cea mai mică) – de aici și numele „Ceilalți mai mici pătrați”. +Apoi adunăm toate aceste valori pătrate. Scopul nostru este să găsim linia specifică unde această sumă finală este minimă (cea mai mică valoare posibilă) - de aici și numele „Cei mai mici pătrate”. -> **🧮 Arată-mi matematica** -> -> Această linie, numită _linia de cea mai bună potrivire_, poate fi exprimată prin [o ecuație](https://en.wikipedia.org/wiki/Simple_linear_regression): -> +> **🧮 Arată-mi matematica** +> +> Această linie, denumită _linia cea mai potrivită_ poate fi exprimată prin [o ecuație](https://en.wikipedia.org/wiki/Simple_linear_regression): +> > ``` > Y = a + bX > ``` > -> `X` este „variabila explicativă”. `Y` este „variabila dependentă”. Panta liniei este `b` iar `a` este interceptul pe axa y, care se referă la valoarea lui `Y` când `X = 0`. +> `X` este 'variabila explicativă'. `Y` este 'variabila dependentă'. Panta liniei este `b` iar `a` este interceptul pe axa y, care se referă la valoarea lui `Y` când `X = 0`. > ->![calculează panta](../../../../translated_images/ro/slope.f3c9d5910ddbfcf9.webp) +>![calculate the slope](../../../../translated_images/ro/slope.f3c9d5910ddbfcf9.webp) > -> Mai întâi, calculează panta `b`. Infografic realizat de [Jen Looper](https://twitter.com/jenlooper) +> Mai întâi, calculăm panta `b`. Infografic de [Jen Looper](https://twitter.com/jenlooper) > -> Cu alte cuvinte, referindu-ne la întrebarea originală din datele noastre despre dovleci: „prezice prețul unui dovleac pe bushel în funcție de lună”, `X` se referă la preț, iar `Y` la luna vânzării. +> Cu alte cuvinte, referindu-ne la întrebarea inițială din datele noastre despre dovleci: „prezice prețul unui dovleac pe bushel pe lună”, `X` s-ar referi la preț iar `Y` s-ar referi la luna vânzării. > ->![completează ecuația](../../../../translated_images/ro/calculation.a209813050a1ddb1.webp) +>![complete the equation](../../../../translated_images/ro/calculation.a209813050a1ddb1.webp) > -> Calculează valoarea lui Y. Dacă plătești în jur de 4 dolari, trebuie să fie aprilie! Infografic realizat de [Jen Looper](https://twitter.com/jenlooper) +> Calculează valoarea lui Y. Dacă plătești în jur de 4 dolari, trebuie să fie aprilie! Infografic de [Jen Looper](https://twitter.com/jenlooper) > -> Matematica care calculează linia trebuie să demonstreze panta liniei, care depinde și de intercept, adică locul unde se află `Y` când `X = 0`. +> Matematica care calculează linia trebuie să demonstreze panta liniei, care depinde și de intercept, sau unde se situează `Y` când `X = 0`. > -> Poți observa metoda de calcul pentru aceste valori pe site-ul [Math is Fun](https://www.mathsisfun.com/data/least-squares-regression.html). De asemenea, vizitează [acest calculator de cei mai mici pătrați](https://www.mathsisfun.com/data/least-squares-calculator.html) pentru a vedea cum valorile numerelor influențează linia. +> Puteți observa metoda de calcul pentru aceste valori pe site-ul [Math is Fun](https://www.mathsisfun.com/data/least-squares-regression.html). Vizitați și [acest calculator pentru cele mai mici pătrate](https://www.mathsisfun.com/data/least-squares-calculator.html) pentru a vedea cum valorile numerelor influențează linia. -## Corelația +## Corelație -Un termen în plus de înțeles este **Coeficientul de corelație** între variabilele date X și Y. Folosind un grafic dispersie, poți vizualiza rapid acest coeficient. Un grafic cu puncte dispersate într-o linie ordonată are corelație mare, iar un grafic cu puncte dispersate peste tot între X și Y are corelație scăzută. +Un alt termen pe care trebuie să-l înțelegem este **Coeficientul de Corelație** între variabilele date X și Y. Folosind un grafic de dispersie, puteți vizualiza rapid acest coeficient. Un grafic cu puncte de date răspândite într-o linie ordonată are corelație ridicată, iar un grafic cu punctele de date presărate peste tot între X și Y are corelație scăzută. -Un model bun de regresie liniară va fi unul care are un coeficient de corelație ridicat (mai aproape de 1 decât de 0) folosind metoda regresiei celor mai mici pătrate cu o linie de regresie. +Un model bun de regresie liniară va fi unul care are un coeficient de corelație mare (mai aproape de 1 decât de 0) folosind metoda regresiei celor mai mici pătrate cu linia de regresie. -✅ Rulează jurnalul însoțitor acestei lecții și uită-te la graficul dispersie Lună vs. Preț. Datele care leagă Luna de Preț pentru vânzările de dovleci par să aibă corelație mare sau mică, conform interpretării tale vizuale a graficului? Se schimbă asta dacă folosești o măsurătoare mai detaliată în loc de `Month`, de ex. *ziua anului* (adică numărul de zile de la începutul anului)? +✅ Rulați notebook-ul care însoțește această lecție și priviți graficul de dispersie Lună versus Preț. Datele care asociază Luna cu Prețul pentru vânzările de dovleci par să aibă corelație mare sau mică, conform interpretării dvs. vizuale a graficului? Se schimbă dacă folosiți o măsură mai detaliată în loc de `Lună`, de ex. *ziua din an* (adică numărul de zile de la începutul anului)? -În codul de mai jos, vom presupune că am curățat datele și am obținut un tabel de date numit `new_pumpkins`, similar cu următorul: +În codul de mai jos, vom presupune că am curățat datele și am obținut un DataFrame numit `new_pumpkins`, similar cu următorul: -ID | Month | DayOfYear | Variety | City | Package | Low Price | High Price | Price +ID | Lună | ZiDinAn | Varietate | Oraș | Ambalaj | Preț Minim | Preț Maxim | Preț ---|-------|-----------|---------|------|---------|-----------|------------|------- -70 | 9 | 267 | PIE TYPE | BALTIMORE | 1 1/9 bushel cartons | 15.0 | 15.0 | 13.636364 -71 | 9 | 267 | PIE TYPE | BALTIMORE | 1 1/9 bushel cartons | 18.0 | 18.0 | 16.363636 -72 | 10 | 274 | PIE TYPE | BALTIMORE | 1 1/9 bushel cartons | 18.0 | 18.0 | 16.363636 -73 | 10 | 274 | PIE TYPE | BALTIMORE | 1 1/9 bushel cartons | 17.0 | 17.0 | 15.454545 -74 | 10 | 281 | PIE TYPE | BALTIMORE | 1 1/9 bushel cartons | 15.0 | 15.0 | 13.636364 +70 | 9 | 267 | TIP PENTRU PLĂCINTĂ | BALTIMORE | cutii de 1 1/9 bushel | 15.0 | 15.0 | 13.636364 +71 | 9 | 267 | TIP PENTRU PLĂCINTĂ | BALTIMORE | cutii de 1 1/9 bushel | 18.0 | 18.0 | 16.363636 +72 | 10 | 274 | TIP PENTRU PLĂCINTĂ | BALTIMORE | cutii de 1 1/9 bushel | 18.0 | 18.0 | 16.363636 +73 | 10 | 274 | TIP PENTRU PLĂCINTĂ | BALTIMORE | cutii de 1 1/9 bushel | 17.0 | 17.0 | 15.454545 +74 | 10 | 281 | TIP PENTRU PLĂCINTĂ | BALTIMORE | cutii de 1 1/9 bushel | 15.0 | 15.0 | 13.636364 -> Codul pentru curățarea datelor este disponibil în [`notebook.ipynb`](notebook.ipynb). Am efectuat aceiași pași de curățare ca în lecția precedentă și am calculat coloana `DayOfYear` folosind expresia următoare: +> Codul pentru curățarea datelor este disponibil în [`notebook.ipynb`](notebook.ipynb). Am efectuat aceiași pași de curățare ca în lecția anterioară și am calculat coloana `DayOfYear` folosind expresia următoare: ```python day_of_year = pd.to_datetime(pumpkins['Date']).apply(lambda dt: (dt-datetime(dt.year,1,1)).days) ``` -Acum că ai o înțelegere a matematicii din spatele regresiei liniare, să creăm un model de regresie pentru a vedea dacă putem prezice care pachet de dovleci va avea cele mai bune prețuri. Cineva care cumpără dovleci pentru o patch de dovleci de sărbători ar putea dori această informație pentru a-și optimiza achizițiile de pachete de dovleci pentru patch. +Acum că aveți o înțelegere a matematicii din spatele regresiei liniare, să creăm un model de regresie pentru a vedea dacă putem prezice care ambalaj de dovleci va avea cele mai bune prețuri. Cineva care cumpără dovleci pentru o copertină specială pentru sărbători ar putea dori aceste informații pentru a-și optimiza achizițiile de pachete de dovleci pentru acea copertină. -## Căutând corelație +## Căutarea corelației -[![ML pentru începători - Căutând Corelația: Cheia regresiei liniare](https://img.youtube.com/vi/uoRq-lW2eQo/0.jpg)](https://youtu.be/uoRq-lW2eQo "ML pentru începători - Căutând Corelația: Cheia regresiei liniare") +[![ML for beginners - Looking for Correlation: The Key to Linear Regression](https://img.youtube.com/vi/uoRq-lW2eQo/0.jpg)](https://youtu.be/uoRq-lW2eQo "ML for beginners - Looking for Correlation: The Key to Linear Regression") -> 🎥 Dă click pe imaginea de mai sus pentru un scurt videoclip despre corelație. +> 🎥 Faceți click pe imaginea de mai sus pentru un scurt videoclip despre corelație. -Din lecția precedentă probabil ai observat că prețul mediu pentru diferite luni arată astfel: +Din lecția anterioară probabil ați văzut că prețul mediu pentru diferite luni arată astfel: -Prețul mediu pe lună +Average price by month -Acest lucru sugerează că ar trebui să existe o corelație, și putem încerca să antrenăm un model de regresie liniară pentru a prezice relația dintre `Month` și `Price`, sau dintre `DayOfYear` și `Price`. Iată graficul dispersie care arată această a doua relație: +Acest lucru sugerează că ar trebui să existe o corelație și putem încerca să antrenăm un model de regresie liniară pentru a prezice relația dintre `Lună` și `Preț`, sau între `ZiDinAn` și `Preț`. Iată graficul de dispersie care arată ultima relație: -Grafic dispersie al Prețului vs Ziua anului +Scatter plot of Price vs. Day of Year -Să vedem dacă există corelație folosind funcția `corr`: +Să vedem dacă există o corelație folosind funcția `corr`: ```python print(new_pumpkins['Month'].corr(new_pumpkins['Price'])) print(new_pumpkins['DayOfYear'].corr(new_pumpkins['Price'])) ``` -Se pare că corelația este destul de mică, -0.15 pentru `Month` și -0.17 pentru `DayOfMonth`, dar ar putea exista o altă relație importantă. Se pare că există clustere diferite de prețuri corespunzătoare diferitelor soiuri de dovleci. Pentru a confirma această ipoteză, să desenăm fiecare categorie de dovleci cu o culoare diferită. Transmitând parametrul `ax` către funcția de plotare `scatter` putem plota toate punctele pe același grafic: +Se pare că corelația este destul de mică, -0.15 folosind `Month` și -0.17 folosind `DayOfMonth`, dar ar putea exista o altă relație importantă. Se pare că există grupuri diferite de prețuri care corespund diferitelor varietăți de dovleci. Pentru a confirma această ipoteză, să afișăm fiecare categorie de dovleci folosind o culoare diferită. Prin trecerea unui parametru `ax` funcției de plotare `scatter` putem afișa toate punctele pe același grafic: ```python ax=None @@ -140,42 +140,42 @@ for i,var in enumerate(new_pumpkins['Variety'].unique()): ax = df.plot.scatter('DayOfYear','Price',ax=ax,c=colors[i],label=var) ``` -Grafic dispersie al Prețului vs Ziua anului +Scatter plot of Price vs. Day of Year -Investigația noastră sugerează că soiul are un efect mai mare asupra prețului total decât data efectivă a vânzării. Putem vedea asta cu un grafic cu bare: +Investigația noastră sugerează că varietatea are mai mult efect asupra prețului general decât data efectivă de vânzare. Putem observa acest lucru cu un grafic cu bare: ```python new_pumpkins.groupby('Variety')['Price'].mean().plot(kind='bar') ``` -Grafic cu bare al prețului vs soiului +Bar graph of price vs variety -Să ne concentrăm momentan doar pe un soi de dovleci, cel „pie type”, și să vedem ce efect are data asupra prețului: +Să ne concentrăm pentru moment doar pe o varietate de dovleac, „tip plăcintă”, și să vedem ce efect are data asupra prețului: ```python pie_pumpkins = new_pumpkins[new_pumpkins['Variety']=='PIE TYPE'] pie_pumpkins.plot.scatter('DayOfYear','Price') ``` -Grafic dispersie al Prețului vs Ziua anului +Scatter plot of Price vs. Day of Year -Dacă acum calculăm corelația dintre `Price` și `DayOfYear` folosind funcția `corr`, vom obține ceva de genul `-0.27` - ceea ce înseamnă că antrenarea unui model predictiv are sens. +Dacă acum calculăm corelația între `Price` și `DayOfYear` folosind funcția `corr`, vom obține ceva în jur de `-0.27` - ceea ce înseamnă că antrenarea unui model predictiv are sens. -> Înainte de a antrena un model de regresie liniară, este important să ne asigurăm că datele sunt curate. Regresia liniară nu funcționează bine cu valori lipsă, deci este recomandat să eliminăm toate celulele goale: +> Înainte de a antrena un model de regresie liniară, este important să ne asigurăm că datele noastre sunt curate. Regresia liniară nu funcționează bine cu valori lipsă, astfel că are sens să eliminăm toate celulele goale: ```python pie_pumpkins.dropna(inplace=True) pie_pumpkins.info() ``` -O altă abordare ar fi să completăm acele valori lipsă cu valorile medii din coloana corespunzătoare. +O altă abordare ar fi să completăm acele valori goale cu valorile medii din coloana corespunzătoare. ## Regresie liniară simplă -[![ML pentru începători - Regresie liniară și polinomială folosind Scikit-learn](https://img.youtube.com/vi/e4c_UP2fSjg/0.jpg)](https://youtu.be/e4c_UP2fSjg "ML pentru începători - Regresie liniară și polinomială folosind Scikit-learn") +[![ML for beginners - Linear and Polynomial Regression using Scikit-learn](https://img.youtube.com/vi/e4c_UP2fSjg/0.jpg)](https://youtu.be/e4c_UP2fSjg "ML for beginners - Linear and Polynomial Regression using Scikit-learn") -> 🎥 Dă click pe imaginea de mai sus pentru un scurt videoclip despre regresia liniară și polinomială. +> 🎥 Faceți click pe imaginea de mai sus pentru un scurt videoclip despre regresia liniară și polinomială. -Pentru a antrena modelul nostru de regresie liniară vom folosi biblioteca **Scikit-learn**. +Pentru a antrena modelul nostru de regresie liniară, vom folosi biblioteca **Scikit-learn**. ```python from sklearn.linear_model import LinearRegression @@ -183,46 +183,46 @@ from sklearn.metrics import mean_squared_error from sklearn.model_selection import train_test_split ``` -Începem prin separarea valorilor de intrare (caracteristici) și a ieșirii așteptate (etichetei) în array-uri numpy separate: +Începem prin separarea valorilor de intrare (caracteristici) și a ieșirii așteptate (eticheta) în array-uri numpy separate: ```python X = pie_pumpkins['DayOfYear'].to_numpy().reshape(-1,1) y = pie_pumpkins['Price'] ``` -> Observă că a fost necesară folosirea metodei `reshape` pe datele de intrare pentru ca pachetul de regresie liniară să le înțeleagă corect. Regresia liniară așteaptă un array 2D ca intrare, unde fiecare rând al array-ului corespunde unui vector de caracteristici de intrare. În cazul nostru, deoarece avem o singură intrare, avem nevoie de un array cu forma N×1, unde N este dimensiunea setului de date. +> Observați că a fost necesar să facem `reshape` pe datele de intrare pentru ca pachetul de Regresie Liniară să înțeleagă corect datele. Regresia liniară așteaptă un array 2D ca intrare, unde fiecare rând al array-ului corespunde unui vector de caracteristici. În cazul nostru, pentru că avem o singură intrare - avem nevoie de un array cu forma N×1, unde N este dimensiunea setului de date. -Apoi, trebuie să împărțim datele în seturi de antrenament și test pentru a valida modelul după antrenare: +Apoi, trebuie să împărțim datele în seturi de antrenament și de test, astfel încât să putem valida modelul după antrenare: ```python X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) ``` -În cele din urmă, antrenarea modelelor propriu-zise de regresie liniară se face în doar două linii de cod. Definim obiectul `LinearRegression`, și îl potrivim pe date folosind metoda `fit`: +În final, antrenarea propriu-zisă a modelului de regresie liniară durează doar două linii de cod. Definim obiectul `LinearRegression`, și îl ajustăm la datele noastre folosind metoda `fit`: ```python lin_reg = LinearRegression() lin_reg.fit(X_train,y_train) ``` -Obiectul `LinearRegression` după `fit`-are conține toți coeficienții regresiei, care pot fi accesați folosind proprietatea `.coef_`. În cazul nostru, există doar un coeficient, care ar trebui să fie în jur de `-0.017`. Aceasta înseamnă că prețurile par să scadă puțin în timp, dar nu prea mult, în jur de 2 cenți pe zi. De asemenea, putem accesa punctul de intersecție al regresiei cu axa Y folosind `lin_reg.intercept_` - acesta va fi în jur de `21` în cazul nostru, indicând prețul la începutul anului. +Obiectul `LinearRegression` după ce a fost `fit`-at conține toți coeficienții regresiei, care pot fi accesati folosind proprietatea `.coef_`. În cazul nostru, există un singur coeficient, care ar trebui să fie în jur de `-0.017`. Aceasta înseamnă că prețurile par să scadă puțin în timp, dar nu prea mult, în jur de 2 cenți pe zi. Putem, de asemenea, să accesăm punctul de intersecție al regresiei cu axa Y folosind `lin_reg.intercept_` - acesta va fi în jur de `21` în cazul nostru, indicând prețul la începutul anului. -Pentru a vedea cât de precis este modelul nostru, putem prezice prețurile pe un set de date de test, apoi putem măsura cât de aproape sunt predicțiile noastre de valorile așteptate. Acest lucru se poate face folosind metrica eroarea pătratică medie (MSE), care este media tuturor diferențelor pătrate dintre valori așteptate și valori prezise. +Pentru a vedea cât de precis este modelul nostru, putem prezice prețurile pe un set de date de testare și apoi măsura cât de apropiate sunt predicțiile noastre de valorile așteptate. Acest lucru se poate face folosind metrici de eroare pătratică medie rădăcină (RMSE), care este rădăcina mediei tuturor diferențelor pătratice între valoarea așteptată și cea prezisă. ```python pred = lin_reg.predict(X_test) -mse = np.sqrt(mean_squared_error(y_test,pred)) -print(f'Mean error: {mse:3.3} ({mse/np.mean(pred)*100:3.3}%)') +rmse = np.sqrt(mean_squared_error(y_test,pred)) +print(f'RMSE: {rmse:3.3} ({rmse/np.mean(pred)*100:3.3}%)') ``` -Eroarea noastră pare să fie în jur de 2 puncte, ceea ce este ~17%. Nu prea bine. Un alt indicator al calității modelului este **coeficientul de determinare**, care poate fi obținut astfel: +Eroarea noastră pare să fie în jur de 2 puncte, ceea ce este ~17%. Nu foarte bine. Un alt indicator al calității modelului este **coeficientul de determinare**, care poate fi obținut astfel: ```python score = lin_reg.score(X_train,y_train) print('Model determination: ', score) ``` -Dacă valoarea este 0, înseamnă că modelul nu ia în considerare datele de intrare și acționează ca *cel mai slab predictor liniar*, care este pur și simplu o valoare medie a rezultatului. Valoarea 1 înseamnă că putem prezice perfect toate rezultatele așteptate. În cazul nostru, coeficientul este în jur de 0.06, ceea ce este destul de scăzut. +Dacă valoarea este 0, înseamnă că modelul nu ia în considerare datele de intrare și acționează ca *cel mai slab predictor liniar*, care este pur și simplu valoarea medie a rezultatului. Valoarea 1 înseamnă că putem prezice perfect toate ieșirile așteptate. În cazul nostru, coeficientul este în jur de 0.06, ceea ce este destul de mic. Putem, de asemenea, să reprezentăm grafic datele de test împreună cu linia de regresie pentru a vedea mai bine cum funcționează regresia în cazul nostru: @@ -235,17 +235,17 @@ plt.plot(X_test,pred) ## Regresie Polinomială -Un alt tip de Regressie Liniară este Regresia Polinomială. Deși uneori există o relație liniară între variabile - cu cât dovleacul este mai mare ca volum, cu atât este mai mare prețul - uneori aceste relații nu pot fi reprezentate ca un plan sau o linie dreaptă. +Un alt tip de Regresie Liniară este Regresia Polinomială. Deși uneori există o relație liniară între variabile - cu cât dovleacul are un volum mai mare, cu atât prețul este mai mare - uneori aceste relații nu pot fi reprezentate ca un plan sau o linie dreaptă. -✅ Iată [câteva exemple suplimentare](https://online.stat.psu.edu/stat501/lesson/9/9.8) de date care ar putea necesita Regresie Polinomială +✅ Iată [câteva exemple suplimentare](https://online.stat.psu.edu/stat501/lesson/9/9.8) de date pentru care s-ar putea folosi Regresia Polinomială -Privim din nou relația dintre Data și Preț. Pare acest scatterplot să trebuiască neapărat analizat printr-o linie dreaptă? Nu pot prețurile fluctua? În acest caz, poți încerca regresia polinomială. +Uită-te din nou la relația dintre Data și Preț. Se pare că acest scatterplot ar trebui neapărat analizat cu o linie dreaptă? Nu pot prețurile să fluctueze? În acest caz, poți încerca regresia polinomială. -✅ Polinoamele sunt expresii matematice care pot consta din unul sau mai mulți termeni și coeficienți +✅ Polinoamele sunt expresii matematice care pot consta din una sau mai multe variabile și coeficienți -Regresia polinomială creează o curbă pentru a se potrivi mai bine datelor neliniare. În cazul nostru, dacă includem o variabilă pătratică `DayOfYear` în datele de intrare, ar trebui să putem ajusta datele noastre cu o curbă parabolică, care va avea un minim într-un anumit punct din an. +Regresia polinomială creează o curbă pentru a se potrivi mai bine datelor neliniare. În cazul nostru, dacă includem o variabilă `DayOfYear` la pătrat în datele de intrare, ar trebui să putem potrivi datele noastre cu o curbă parabolică, care va avea un minim într-un anumit punct al anului. -Scikit-learn include un util [API pipeline](https://scikit-learn.org/stable/modules/generated/sklearn.pipeline.make_pipeline.html?highlight=pipeline#sklearn.pipeline.make_pipeline) pentru a combina diferite etape de procesare a datelor împreună. Un **pipeline** este un lanț de **estimatori**. În cazul nostru, vom crea un pipeline care mai întâi adaugă caracteristici polinomiale modelului, apoi antrenează regresia: +Scikit-learn include un API util [pipeline](https://scikit-learn.org/stable/modules/generated/sklearn.pipeline.make_pipeline.html?highlight=pipeline#sklearn.pipeline.make_pipeline) pentru a combina împreună diferitele etape ale procesării datelor. Un **pipeline** este un lanț de **estimatori**. În cazul nostru, vom crea un pipeline care mai întâi adaugă caracteristici polinomiale modelului nostru, apoi antrenează regresia: ```python from sklearn.preprocessing import PolynomialFeatures @@ -256,36 +256,36 @@ pipeline = make_pipeline(PolynomialFeatures(2), LinearRegression()) pipeline.fit(X_train,y_train) ``` -Folosind `PolynomialFeatures(2)` înseamnă că vom include toți polinomii de gradul doi din datele de intrare. În cazul nostru, aceasta înseamnă doar `DayOfYear`2, dar având două variabile de intrare X și Y, aceasta va adăuga X2, XY și Y2. Putem de asemenea să folosim polinoame de grad mai înalt dacă dorim. +Folosind `PolynomialFeatures(2)` înseamnă că vom include toate polinoamele de gradul al doilea din datele de intrare. În cazul nostru, aceasta va însemna doar `DayOfYear`2, dar dat fiind două variabile de intrare X și Y, aceasta va adăuga X2, XY și Y2. Putem folosi, de asemenea, polinoame de grad mai mare dacă dorim. Pipeline-urile pot fi folosite în același mod ca obiectul original `LinearRegression`, adică putem face `fit` pe pipeline, apoi folosi `predict` pentru a obține rezultatele predicției. Iată graficul care arată datele de test și curba de aproximare: Polynomial regression -Folosind Regresia Polinomială, putem obține o MSE puțin mai mică și un coeficient de determinare mai mare, dar fără o îmbunătățire semnificativă. Trebuie să luăm în considerare și alte caracteristici! +Folosind Regresia Polinomială, putem obține un MSE ușor mai mic și un coeficient de determinare mai mare, dar nu semnificativ. Trebuie să luăm în considerare și alte caracteristici! -> Se poate observa că prețurile minime ale dovlecilor sunt observate în jur de Halloween. Cum ai putea explica acest lucru? +> Poți vedea că prețurile minime ale dovlecilor sunt observate undeva în jurul Halloween-ului. Cum poți explica asta? -🎃 Felicitări, tocmai ai creat un model care poate ajuta la prezicerea prețului dovlecilor pentru plăcintă. Probabil poți repeta aceeași procedură pentru toate tipurile de dovleci, dar asta ar fi obositor. Acum să învățăm cum să luăm în calcul soiul de dovleac în modelul nostru! +🎃 Felicitări, ai creat un model care te poate ajuta să prezici prețul dovlecilor pentru plăcintă. Probabil că poți repeta aceeași procedură pentru toate tipurile de dovleci, dar ar fi obositor. Hai să învățăm acum cum să luăm în considerare varietatea de dovleci în modelul nostru! -## Caracteristici categorice +## Caracteristici Categorice -În lumea ideală, vrem să putem prezice prețurile pentru diferite soiuri de dovleci folosind același model. Totuși, coloana `Variety` este oarecum diferită de coloane precum `Month`, pentru că conține valori nenumerice. Astfel de coloane se numesc **categorice**. +În lumea ideală, vrem să putem prezice prețurile pentru diferite varietăți de dovleci folosind același model. Totuși, coloana `Variety` este oarecum diferită față de coloane precum `Month`, pentru că conține valori nenumerice. Astfel de coloane sunt numite **categorice**. -[![ML pentru începători - Predicții cu caracteristici categorice în regresia liniară](https://img.youtube.com/vi/DYGliioIAE0/0.jpg)](https://youtu.be/DYGliioIAE0 "ML pentru începători - Predicții cu caracteristici categorice în regresia liniară") +[![ML for beginners - Categorical Feature Predictions with Linear Regression](https://img.youtube.com/vi/DYGliioIAE0/0.jpg)](https://youtu.be/DYGliioIAE0 "ML for beginners - Categorical Feature Predictions with Linear Regression") -> 🎥 Fă click pe imaginea de mai sus pentru un scurt videoclip despre utilizarea caracteristicilor categorice. +> 🎥 Apasă pe imaginea de mai sus pentru un scurt videoclip despre folosirea caracteristicilor categorice. -Aici poți vedea cum prețul mediu depinde de soi: +Aici poți vedea cum depinde prețul mediu de varietate: Average price by variety -Pentru a lua în calcul soiul, mai întâi trebuie să-l convertim în formă numerică, sau să-l **encodăm**. Există mai multe moduri de a face asta: +Pentru a lua în considerare varietatea, trebuie mai întâi să o convertim în formă numerică, sau să o **encodăm**. Există mai multe moduri în care putem face asta: -* O simplă **codificare numerică** va crea un tabel cu soiurile diferite și apoi va înlocui numele soiului cu un index din acel tabel. Aceasta nu este o idee bună pentru regresia liniară, deoarece regresia liniară ia valoarea numerică efectivă a indexului și o adaugă în rezultat, înmulțind cu un coeficient. În cazul nostru, relația dintre numărul indexului și preț este clar neliniară, chiar dacă ne asigurăm că indicii sunt ordonați într-un anumit mod. -* **Codificarea one-hot** va înlocui coloana `Variety` cu 4 coloane diferite, câte una pentru fiecare soi. Fiecare coloană va conține `1` dacă rândul respectiv este dintr-un anumit soi și `0` în caz contrar. Aceasta înseamnă că vor exista patru coeficienți în regresia liniară, câte unul pentru fiecare soi de dovleac, responsabili pentru „prețul de bază” (sau mai degrabă „prețul suplimentar”) pentru acel soi în particular. +* Encodarea numerică simplă construită o tabelă cu diferite varietăți, apoi înlocuiește numele varietății cu un indice în acea tabelă. Aceasta nu este o idee bună pentru regresia liniară, deoarece regresia liniară ia valoarea numerică reală a indicelui și o adaugă la rezultat, înmulțind cu un coeficient. În cazul nostru, relația dintre numărul indicelui și preț este clar neliniară, chiar dacă ne asigurăm că indicii sunt ordonați într-un anumit mod. +* Encodarea one-hot va înlocui coloana `Variety` cu 4 coloane diferite, câte una pentru fiecare varietate. Fiecare coloană va conține `1` dacă rândul respectiv aparține acestei varietăți și `0` altfel. Aceasta înseamnă că vor exista patru coeficienți în regresia liniară, câte unul pentru fiecare varietate de dovleac, responsabili pentru "prețul de pornire" (sau mai bine zis "prețul suplimentar") pentru acea varietate anume. -Codul de mai jos arată cum putem aplica one-hot encoding pentru soi: +Codul de mai jos arată cum putem face one-hot encoding pentru o varietate: ```python pd.get_dummies(new_pumpkins['Variety']) @@ -302,14 +302,14 @@ pd.get_dummies(new_pumpkins['Variety']) 1741 | 0 | 1 | 0 | 0 1742 | 0 | 1 | 0 | 0 -Pentru a antrena regresia liniară folosind soiul one-hot encoded drept intrare, trebuie doar să inițializăm corect datele X și y: +Pentru a antrena regresia liniară folosind varietatea encodată one-hot ca intrare, trebuie doar să inițializăm corect datele `X` și `y`: ```python X = pd.get_dummies(new_pumpkins['Variety']) y = new_pumpkins['Price'] ``` -Restul codului este la fel ca cel folosit mai sus pentru a antrena regresia liniară. Dacă încerci, vei vedea că eroarea pătratică medie este cam aceeași, dar coeficientul de determinare crește mult (~77%). Pentru predicții și mai precise, putem lua în calcul mai multe caracteristici categorice, precum și caracteristici numerice, cum ar fi `Month` sau `DayOfYear`. Pentru a obține un singur set mare de caracteristici, putem folosi `join`: +Restul codului este la fel ca cel folosit mai sus pentru antrenarea regresiei liniare. Dacă încerci, vei vedea că eroarea pătratică medie este cam la fel, dar coeficientul de determinare crește mult (~77%). Pentru a obține predicții și mai precise, putem lua în considerare mai multe caracteristici categorice, precum și caracteristici numerice, cum ar fi `Month` sau `DayOfYear`. Pentru a obține un singur tablou mare de caracteristici, putem folosi `join`: ```python X = pd.get_dummies(new_pumpkins['Variety']) \ @@ -319,31 +319,31 @@ X = pd.get_dummies(new_pumpkins['Variety']) \ y = new_pumpkins['Price'] ``` -Aici luăm în considerare și `City` și tipul `Package`, ceea ce ne oferă MSE 2.84 (10%) și coeficient de determinare 0.94! +Aici luăm în considerare și `City` și tipul de `Package`, ceea ce ne oferă un MSE de 2.84 (10%) și un coeficient de determinare de 0.94! -## Combinând totul +## Punând totul cap la cap -Pentru a face cel mai bun model, putem folosi date combinate (categorice one-hot encoded + numerice) din exemplul de mai sus împreună cu Regresia Polinomială. Iată codul complet pentru conveniența ta: +Pentru a face cel mai bun model, putem folosi date combinate (categorice one-hot encode + numerice) din exemplul de mai sus împreună cu Regresia Polinomială. Iată codul complet pentru confortul tău: ```python -# configurare date de antrenament +# configurează datele de antrenament X = pd.get_dummies(new_pumpkins['Variety']) \ .join(new_pumpkins['Month']) \ .join(pd.get_dummies(new_pumpkins['City'])) \ .join(pd.get_dummies(new_pumpkins['Package'])) y = new_pumpkins['Price'] -# realizare divizare antrenament-test +# realizează împărțirea în seturi de antrenament și test X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) -# configurare și antrenare pipeline +# configurează și antrenează pipeline-ul pipeline = make_pipeline(PolynomialFeatures(2), LinearRegression()) pipeline.fit(X_train,y_train) -# prezice rezultate pentru datele de test +# prezice rezultatele pentru datele de test pred = pipeline.predict(X_test) -# calculare MSE și coeficient de determinare +# calculează MSE și coeficientul de determinare mse = np.sqrt(mean_squared_error(y_test,pred)) print(f'Mean error: {mse:3.3} ({mse/np.mean(pred)*100:3.3}%)') @@ -351,36 +351,36 @@ score = pipeline.score(X_train,y_train) print('Model determination: ', score) ``` -Aceasta ar trebui să ne ofere cel mai bun coeficient de determinare de aproape 97% și MSE=2.23 (~8% eroare de predicție). +Aceasta ne va da cel mai bun coeficient de determinare de aproape 97%, și MSE=2.23 (~8% eroare de predicție). -| Model | MSE | Determinare | -|-------|-----|-------------| -| Linear `DayOfYear` | 2.77 (17.2%) | 0.07 | -| Polinomial `DayOfYear` | 2.73 (17.0%) | 0.08 | -| Linear `Variety` | 5.24 (19.7%) | 0.77 | -| Linear toate caracteristicile | 2.84 (10.5%) | 0.94 | -| Polinomial toate caracteristicile | 2.23 (8.25%) | 0.97 | +| Model | MSE | Determinarea | +|-------|-----|--------------| +| Liniară `DayOfYear` | 2.77 (17.2%) | 0.07 | +| Polinomială `DayOfYear` | 2.73 (17.0%) | 0.08 | +| Liniară `Variety` | 5.24 (19.7%) | 0.77 | +| Toate caracteristicile Liniară | 2.84 (10.5%) | 0.94 | +| Toate caracteristicile Polinomială | 2.23 (8.25%) | 0.97 | -🏆 Foarte bine! Ai creat patru modele de Regresie într-o singură lecție și ai îmbunătățit calitatea modelului la 97%. În secțiunea finală despre Regresie vei învăța despre Regresia Logistică pentru determinarea categoriilor. +🏆 Foarte bine! Ai creat patru modele de regresie într-o lecție și ai îmbunătățit calitatea modelului la 97%. În secțiunea finală despre Regresie, vei învăța despre Regresia Logistică pentru clasificare. --- ## 🚀Provocare -Testează mai multe variabile diferite în acest notebook pentru a vedea cum se corelează acestea cu acuratețea modelului. +Testează mai multe variabile diferite în acest notebook pentru a vedea cum corespunde corelația cu acuratețea modelului. -## [Test post-lector](https://ff-quizzes.netlify.app/en/ml/) +## [Chestionar post-lectură](https://ff-quizzes.netlify.app/en/ml/) -## Recapitulare & Auto-studiu +## Recenzie & Studiu individual -În această lecție am învățat despre Regresia Liniară. Există și alte tipuri importante de Regresie. Citește despre tehnicile Stepwise, Ridge, Lasso și Elasticnet. Un curs bun pentru aprofundare este [Stanford Statistical Learning course](https://online.stanford.edu/courses/sohs-ystatslearning-statistical-learning) +În această lecție am învățat despre Regresia Liniară. Există și alte tipuri importante de regresie. Citește despre tehnicile Stepwise, Ridge, Lasso și Elasticnet. Un curs bun pentru a învăța mai multe este [Stanford Statistical Learning course](https://online.stanford.edu/courses/sohs-ystatslearning-statistical-learning) ## Temă -[Build a Model](assignment.md) +[Construiește un Model](assignment.md) --- -**Declinarea responsabilității**: -Acest document a fost tradus folosind serviciul de traducere automată AI [Co-op Translator](https://github.com/Azure/co-op-translator). Deși ne străduim pentru acuratețe, vă rugăm să rețineți că traducerile automate pot conține erori sau inexactități. Documentul original în limba sa de origine trebuie considerat sursa autoritară. Pentru informații critice, se recomandă traducerea profesională realizată de un specialist uman. Nu ne asumăm nicio responsabilitate pentru eventualele neînțelegeri sau interpretări eronate care pot rezulta din utilizarea acestei traduceri. +**Declinare a responsabilității**: +Acest document a fost tradus folosind serviciul de traducere AI [Co-op Translator](https://github.com/Azure/co-op-translator). Deși ne străduim pentru acuratețe, vă rugăm să rețineți că traducerile automate pot conține erori sau inexactități. Documentul original în limba sa nativă trebuie considerat sursa autorizată. Pentru informații critice, se recomandă traducerea profesională realizată de un specialist uman. Nu ne asumăm răspunderea pentru eventualele neînțelegeri sau interpretări greșite rezultate din utilizarea acestei traduceri. \ No newline at end of file diff --git a/translations/ro/4-Classification/2-Classifiers-1/README.md b/translations/ro/4-Classification/2-Classifiers-1/README.md index 2b2e916f6..93fdd6b7d 100644 --- a/translations/ro/4-Classification/2-Classifiers-1/README.md +++ b/translations/ro/4-Classification/2-Classifiers-1/README.md @@ -1,17 +1,17 @@ # Clasificatori de bucătărie 1 -În această lecție, vei folosi setul de date salvat din lecția anterioară, plin de date echilibrate și curate despre bucătării. +În această lecție, veți folosi setul de date pe care l-ați salvat din lecția anterioară, plin de date echilibrate și curate despre bucătării. -Vei utiliza acest set de date cu o varietate de clasificatori pentru a _prezice o bucătărie națională dată pe baza unui grup de ingrediente_. În timp ce faci acest lucru, vei învăța mai multe despre unele dintre modurile în care algoritmii pot fi utilizați pentru sarcini de clasificare. +Veți folosi acest set de date cu o varietate de clasificatori pentru a _prezice o anumită bucătărie națională pe baza unui grup de ingrediente_. În timp ce faceți acest lucru, veți afla mai multe despre unele dintre modurile în care algoritmii pot fi utilizați pentru sarcini de clasificare. -## [Chestionar înainte de lecție](https://ff-quizzes.netlify.app/en/ml/) +## [Test preliminar înaintea lecției](https://ff-quizzes.netlify.app/en/ml/) # Pregătire -Presupunând că ai finalizat [Lecția 1](../1-Introduction/README.md), asigură-te că un fișier _cleaned_cuisines.csv_ există în folderul rădăcină `/data` pentru aceste patru lecții. +Presupunând că ați terminat [Lecția 1](../1-Introduction/README.md), asigurați-vă că un fișier _cleaned_cuisines.csv_ există în folderul rădăcină `/data` pentru aceste patru lecții. -## Exercițiu - prezicerea unei bucătării naționale +## Exercițiu - prezice o bucătărie națională -1. Lucrând în folderul _notebook.ipynb_ al acestei lecții, importă acel fișier împreună cu biblioteca Pandas: +1. Lucrând în folderul _notebook.ipynb_ al acestei lecții, importați acel fișier împreună cu biblioteca Pandas: ```python import pandas as pd @@ -30,7 +30,7 @@ Presupunând că ai finalizat [Lecția 1](../1-Introduction/README.md), asigură | 4 | 4 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | -1. Acum, importă mai multe biblioteci: +1. Acum, importați câteva biblioteci suplimentare: ```python from sklearn.linear_model import LogisticRegression @@ -40,7 +40,7 @@ Presupunând că ai finalizat [Lecția 1](../1-Introduction/README.md), asigură import numpy as np ``` -1. Împarte coordonatele X și y în două cadre de date pentru antrenament. `cuisine` poate fi cadrul de date pentru etichete: +1. Împărțiți coordonatele X și y în două dataframes pentru antrenare. `cuisine` poate fi dataframe-ul etichetelor: ```python cuisines_label_df = cuisines_df['cuisine'] @@ -58,14 +58,14 @@ Presupunând că ai finalizat [Lecția 1](../1-Introduction/README.md), asigură Name: cuisine, dtype: object ``` -1. Elimină coloana `Unnamed: 0` și coloana `cuisine`, folosind `drop()`. Salvează restul datelor ca caracteristici antrenabile: +1. Eliminați coloana `Unnamed: 0` și coloana `cuisine` folosind `drop()`. Salvați restul datelor ca caracteristici de antrenament: ```python cuisines_feature_df = cuisines_df.drop(['Unnamed: 0', 'cuisine'], axis=1) cuisines_feature_df.head() ``` - Caracteristicile tale arată astfel: + Caracteristicile dvs. arată astfel: | | almond | angelica | anise | anise_seed | apple | apple_brandy | apricot | armagnac | artemisia | artichoke | ... | whiskey | white_bread | white_wine | whole_grain_wheat_flour | wine | wood | yam | yeast | yogurt | zucchini | | ---: | -----: | -------: | ----: | ---------: | ----: | -----------: | ------: | -------: | --------: | --------: | ---: | ------: | ----------: | ---------: | ----------------------: | ---: | ---: | ---: | ----: | -----: | -------: | @@ -75,75 +75,76 @@ Presupunând că ai finalizat [Lecția 1](../1-Introduction/README.md), asigură | 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | -Acum ești gata să îți antrenezi modelul! +Acum sunteți gata să vă antrenați modelul! ## Alegerea clasificatorului -Acum că datele tale sunt curate și pregătite pentru antrenament, trebuie să decizi ce algoritm să folosești pentru sarcină. +Acum că datele dvs. sunt curate și gata pentru antrenament, trebuie să decideți ce algoritm să folosiți pentru sarcină. -Scikit-learn grupează clasificarea sub Învățare Supervizată, iar în această categorie vei găsi multe moduri de a clasifica. [Varietatea](https://scikit-learn.org/stable/supervised_learning.html) poate fi copleșitoare la prima vedere. Metodele următoare includ tehnici de clasificare: +Scikit-learn grupează clasificarea sub Învățare supravegheată, iar în această categorie veți găsi multe moduri de a clasifica. [Varietatea](https://scikit-learn.org/stable/supervised_learning.html) este destul de copleșitoare la prima vedere. Următoarele metode includ toate tehnici de clasificare: - Modele liniare -- Mașini cu vectori de suport -- Gradient descendent stochastic -- Vecini cei mai apropiați -- Procese Gaussiene -- Arbori de decizie -- Metode de ansamblu (clasificator prin vot) +- Mașini cu vectori de susținere +- Descendentă stocastică a gradientului +- Cei mai apropiați vecini +- Procese Gaussiane +- Arbori decizionali +- Metode de ansamblu (voting Classifier) - Algoritmi multiclasă și multioutput (clasificare multiclasă și multilabel, clasificare multiclasă-multioutput) -> Poți folosi și [rețele neuronale pentru a clasifica date](https://scikit-learn.org/stable/modules/neural_networks_supervised.html#classification), dar acest subiect este în afara scopului acestei lecții. +> Puteți folosi și [rețele neuronale pentru a clasifica date](https://scikit-learn.org/stable/modules/neural_networks_supervised.html#classification), dar asta este în afara scopului acestei lecții. -### Ce clasificator să alegi? +### Ce clasificator să alegeți? -Deci, ce clasificator ar trebui să alegi? Deseori, testarea mai multor clasificatori și căutarea unui rezultat bun este o metodă de testare. Scikit-learn oferă o [comparație alăturată](https://scikit-learn.org/stable/auto_examples/classification/plot_classifier_comparison.html) pe un set de date creat, comparând KNeighbors, SVC în două moduri, GaussianProcessClassifier, DecisionTreeClassifier, RandomForestClassifier, MLPClassifier, AdaBoostClassifier, GaussianNB și QuadraticDiscriminationAnalysis, arătând rezultatele vizualizate: +Deci, ce clasificator ar trebui să alegeți? Deseori, rularea mai multora și căutarea unui rezultat bun este o metodă de testare. Scikit-learn oferă o [comparație alăturată](https://scikit-learn.org/stable/auto_examples/classification/plot_classifier_comparison.html) pe un set de date creat, comparând KNeighbors, SVC în două moduri, GaussianProcessClassifier, DecisionTreeClassifier, RandomForestClassifier, MLPClassifier, AdaBoostClassifier, GaussianNB și QuadraticDiscrinationAnalysis, arătând rezultatele vizualizate: -![comparație clasificatori](../../../../4-Classification/2-Classifiers-1/images/comparison.png) -> Grafice generate din documentația Scikit-learn +![comparison of classifiers](../../../../translated_images/ro/comparison.edfab56193a85e7f.webp) +> Grafice generate pe documentația Scikit-learn -> AutoML rezolvă această problemă elegant prin rularea acestor comparații în cloud, permițându-ți să alegi cel mai bun algoritm pentru datele tale. Încearcă [aici](https://docs.microsoft.com/learn/modules/automate-model-selection-with-azure-automl/?WT.mc_id=academic-77952-leestott) +> AutoML rezolvă această problemă elegant rulând aceste comparații în cloud, permițându-vă să alegeți cel mai bun algoritm pentru datele dvs. Încercați-l [aici](https://docs.microsoft.com/learn/modules/automate-model-selection-with-azure-automl/?WT.mc_id=academic-77952-leestott) ### O abordare mai bună -O metodă mai bună decât ghicitul aleatoriu este să urmezi ideile din acest [ML Cheat Sheet](https://docs.microsoft.com/azure/machine-learning/algorithm-cheat-sheet?WT.mc_id=academic-77952-leestott) descărcabil. Aici descoperim că, pentru problema noastră multiclasă, avem câteva opțiuni: +O metodă mai bună decât să ghiciți la întâmplare este să urmați ideile din acest [ML Cheat sheet](https://docs.microsoft.com/azure/machine-learning/algorithm-cheat-sheet?WT.mc_id=academic-77952-leestott) descărcabil. Aici descoperim că, pentru problema noastră multiclasă, avem câteva opțiuni: -![cheatsheet pentru probleme multiclasă](../../../../4-Classification/2-Classifiers-1/images/cheatsheet.png) -> O secțiune din Algorithm Cheat Sheet de la Microsoft, detaliind opțiuni de clasificare multiclasă +![cheatsheet for multiclass problems](../../../../translated_images/ro/cheatsheet.07a475ea444d2223.webp) +> O secțiune a Algorithm Cheat Sheet de la Microsoft, detaliind opțiunile pentru clasificare multiclasă -✅ Descarcă acest cheat sheet, printează-l și agață-l pe perete! +✅ Descărcați această fișă de trucuri, tipăriți-o și puneți-o pe perete! ### Raționament -Să vedem dacă putem raționa prin diferite abordări, având în vedere constrângerile pe care le avem: +Să vedem dacă putem raționa prin diferite abordări date constrângerile pe care le avem: -- **Rețelele neuronale sunt prea grele**. Având în vedere setul nostru de date curat, dar minimal, și faptul că rulăm antrenamentul local prin notebook-uri, rețelele neuronale sunt prea complexe pentru această sarcină. -- **Nu folosim clasificatori cu două clase**. Nu utilizăm un clasificator cu două clase, deci excludem metoda one-vs-all. -- **Arborele de decizie sau regresia logistică ar putea funcționa**. Un arbore de decizie ar putea funcționa, sau regresia logistică pentru date multiclasă. -- **Arborii de decizie boostați multiclasă rezolvă o altă problemă**. Arborele de decizie boostat multiclasă este cel mai potrivit pentru sarcini nonparametrice, de exemplu sarcini concepute pentru a construi clasamente, deci nu este util pentru noi. +- **Rețelele neuronale sunt prea grele**. Având în vedere setul nostru de date curat, dar minimal, și faptul că efectuăm antrenamentul local în notebook-uri, rețelele neuronale sunt prea grele pentru această sarcină. +- **Niciun clasificator cu două clase**. Nu folosim un clasificator cu două clase, deci eliminăm metoda one-vs-all. +- **Arborele decizional sau regresia logistică ar putea funcționa**. Un arbore decizional ar putea funcționa sau regresia logistică pentru date multiclasă. +- **Arborii decizionali multiclasă cu boost rezolvă o problemă diferită**. Arborii decizionali multiclasă cu boost sunt cei mai potriviți pentru sarcini neparametrice, de exemplu, sarcini de construire a unor ranking-uri, deci nu sunt utile pentru noi. -### Utilizarea Scikit-learn +### Folosirea Scikit-learn -Vom folosi Scikit-learn pentru a analiza datele noastre. Totuși, există multe moduri de a utiliza regresia logistică în Scikit-learn. Consultă [parametrii de transmis](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html?highlight=logistic%20regressio#sklearn.linear_model.LogisticRegression). +Vom folosi Scikit-learn pentru a analiza datele noastre. Totuși, există multe moduri de a folosi regresia logistică în Scikit-learn. Consultați [parametrii care trebuie specificați](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html?highlight=logistic%20regressio#sklearn.linear_model.LogisticRegression). -Practic, există doi parametri importanți - `multi_class` și `solver` - pe care trebuie să îi specificăm atunci când cerem Scikit-learn să efectueze o regresie logistică. Valoarea `multi_class` aplică un anumit comportament. Valoarea solverului indică ce algoritm să se folosească. Nu toți solverii pot fi combinați cu toate valorile `multi_class`. +În esență, există doi parametri importanți - `multi_class` și `solver` - pe care trebuie să îi specificăm când cerem Scikit-learn să execute o regresie logistică. Valoarea lui `multi_class` aplică un anumit comportament. Valoarea lui `solver` este algoritmul care va fi folosit. Nu toți solverii pot fi combinați cu toate valorile `multi_class`. Conform documentației, în cazul multiclasă, algoritmul de antrenament: -- **Folosește schema one-vs-rest (OvR)**, dacă opțiunea `multi_class` este setată la `ovr` -- **Folosește pierderea cross-entropy**, dacă opțiunea `multi_class` este setată la `multinomial`. (În prezent, opțiunea `multinomial` este suportată doar de solverii ‘lbfgs’, ‘sag’, ‘saga’ și ‘newton-cg’.)" +- **Folosește schema one-vs-rest (OvR)**, dacă opțiunea `multi_class` este setată pe `ovr` +- **Folosește pierderea de tip cross-entropy**, dacă opțiunea `multi_class` este setată pe `multinomial`. (În prezent, opțiunea `multinomial` este susținută doar de solverii ‘lbfgs’, ‘sag’, ‘saga’ și ‘newton-cg’)." -> 🎓 'Schema' aici poate fi 'ovr' (one-vs-rest) sau 'multinomial'. Deoarece regresia logistică este concepută pentru a susține clasificarea binară, aceste scheme îi permit să gestioneze mai bine sarcinile de clasificare multiclasă. [sursa](https://machinelearningmastery.com/one-vs-rest-and-one-vs-one-for-multi-class-classification/) +> 🎓 'Schema' aici poate fi fie 'ovr' (one-vs-rest), fie 'multinomial'. Deoarece regresia logistică este concepută în principal pentru clasificare binară, aceste scheme îi permit să gestioneze mai bine sarcini de clasificare multiclasă. [sursă](https://machinelearningmastery.com/one-vs-rest-and-one-vs-one-for-multi-class-classification/) -> 🎓 'Solverul' este definit ca "algoritmul utilizat în problema de optimizare". [sursa](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html?highlight=logistic%20regressio#sklearn.linear_model.LogisticRegression). +> 🎓 'Solver-ul' este definit ca "algoritmul folosit în problema de optimizare". [sursă](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html?highlight=logistic%20regressio#sklearn.linear_model.LogisticRegression). -Scikit-learn oferă acest tabel pentru a explica modul în care solverii gestionează diferite provocări prezentate de diferite structuri de date: +Scikit-learn oferă acest tabel pentru a explica cum solverii gestionează diferite provocări prezentate de diverse structuri de date: -![solvers](../../../../4-Classification/2-Classifiers-1/images/solvers.png) +![solvers](../../../../translated_images/ro/solvers.5fc648618529e627.webp) ## Exercițiu - împarte datele -Ne putem concentra pe regresia logistică pentru primul nostru test de antrenament, deoarece ai învățat recent despre aceasta într-o lecție anterioară. -Împarte datele tale în grupuri de antrenament și testare, apelând `train_test_split()`: +Putem să ne concentrăm pe regresia logistică pentru prima noastră încercare de antrenament, deoarece tocmai ați învățat despre ea într-o lecție anterioară. + +Împărțiți datele în grupuri de antrenament și testare folosind `train_test_split()`: ```python X_train, X_test, y_train, y_test = train_test_split(cuisines_feature_df, cuisines_label_df, test_size=0.3) @@ -151,9 +152,9 @@ X_train, X_test, y_train, y_test = train_test_split(cuisines_feature_df, cuisine ## Exercițiu - aplică regresia logistică -Deoarece folosești cazul multiclasă, trebuie să alegi ce _schemă_ să folosești și ce _solver_ să setezi. Folosește LogisticRegression cu o setare multiclasă și solverul **liblinear** pentru antrenament. +Deoarece folosiți cazul multiclasă, trebuie să alegeți ce _schemă_ să folosiți și ce _solver_ să setați. Folosiți LogisticRegression cu setarea multiclasă și solverul **liblinear** pentru antrenament. -1. Creează o regresie logistică cu `multi_class` setat la `ovr` și solverul setat la `liblinear`: +1. Creați o regresie logistică cu multi_class setat pe `ovr` și solver pe `liblinear`: ```python lr = LogisticRegression(multi_class='ovr',solver='liblinear') @@ -163,11 +164,13 @@ Deoarece folosești cazul multiclasă, trebuie să alegi ce _schemă_ să folose print ("Accuracy is {}".format(accuracy)) ``` - ✅ Încearcă un alt solver, cum ar fi `lbfgs`, care este adesea setat ca implicit -> Notă, folosește funcția Pandas [`ravel`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.ravel.html) pentru a aplatiza datele tale atunci când este necesar. -Acuratețea este bună la peste **80%**! + ✅ Încercați un solver diferit precum `lbfgs`, care este adesea setat implicit + + > Notă, folosiți funcția Pandas [`ravel`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.ravel.html) pentru a aplatiza datele când este nevoie. -1. Poți vedea acest model în acțiune testând un rând de date (#50): + Acuratețea este bună, peste **80%**! + +1. Puteți vedea acest model în acțiune testând un rând de date (#50): ```python print(f'ingredients: {X_test.iloc[50][X_test.iloc[50]!=0].keys()}') @@ -181,9 +184,8 @@ Acuratețea este bună la peste **80%**! cuisine: indian ``` - ✅ Încearcă un alt număr de rând și verifică rezultatele - -1. Explorând mai profund, poți verifica acuratețea acestei predicții: + ✅ Încercați un număr diferit de rând și verificați rezultatele +1. Explorând mai în profunzime, poți verifica acuratețea acestei predicții: ```python test= X_test.iloc[50].values.reshape(-1, 1).T @@ -195,7 +197,7 @@ Acuratețea este bună la peste **80%**! topPrediction.head() ``` - Rezultatul este afișat - bucătăria indiană este cea mai probabilă, cu o bună probabilitate: + Rezultatul este afișat - bucătăria indiană este cea mai probabilă variantă, cu o probabilitate bună: | | 0 | | -------: | -------: | @@ -207,7 +209,7 @@ Acuratețea este bună la peste **80%**! ✅ Poți explica de ce modelul este destul de sigur că aceasta este o bucătărie indiană? -1. Obține mai multe detalii prin afișarea unui raport de clasificare, așa cum ai făcut în lecțiile despre regresie: +1. Obține mai multe detalii prin imprimarea unui raport de clasificare, așa cum ai făcut în lecțiile despre regresie: ```python y_pred = model.predict(X_test) @@ -215,30 +217,32 @@ Acuratețea este bună la peste **80%**! ``` | | precizie | recall | f1-score | suport | - | ------------ | -------- | ------ | -------- | ------ | - | chinese | 0.73 | 0.71 | 0.72 | 229 | - | indian | 0.91 | 0.93 | 0.92 | 254 | - | japanese | 0.70 | 0.75 | 0.72 | 220 | - | korean | 0.86 | 0.76 | 0.81 | 242 | - | thai | 0.79 | 0.85 | 0.82 | 254 | - | acuratețe | 0.80 | 1199 | | | - | macro avg | 0.80 | 0.80 | 0.80 | 1199 | - | weighted avg | 0.80 | 0.80 | 0.80 | 1199 | + | ------------ | -------- | ------ | -------- | ------- | + | chinese | 0.73 | 0.71 | 0.72 | 229 | + | indian | 0.91 | 0.93 | 0.92 | 254 | + | japanese | 0.70 | 0.75 | 0.72 | 220 | + | korean | 0.86 | 0.76 | 0.81 | 242 | + | thai | 0.79 | 0.85 | 0.82 | 254 | + | accuracy | | | 0.80 | 1199 | + | macro avg | 0.80 | 0.80 | 0.80 | 1199 | + | weighted avg | 0.80 | 0.80 | 0.80 | 1199 | ## 🚀Provocare -În această lecție, ai folosit datele curățate pentru a construi un model de învățare automată care poate prezice o bucătărie națională pe baza unei serii de ingrediente. Ia-ți timp să explorezi numeroasele opțiuni pe care Scikit-learn le oferă pentru clasificarea datelor. Explorează mai profund conceptul de 'solver' pentru a înțelege ce se întâmplă în culise. +În această lecție, ai folosit datele curate pentru a construi un model de învățare automată care poate prezice o bucătărie națională pe baza unui set de ingrediente. Ia-ți timp să parcurgi multiplele opțiuni pe care Scikit-learn le oferă pentru clasificarea datelor. Aprofundează conceptul de 'solver' pentru a înțelege ce se întâmplă în culise. -## [Chestionar post-lecție](https://ff-quizzes.netlify.app/en/ml/) +## [Chestionar post-lectură](https://ff-quizzes.netlify.app/en/ml/) -## Recapitulare & Studiu Individual +## Recapitulare & Studiu individual -Explorează puțin mai mult matematica din spatele regresiei logistice în [această lecție](https://people.eecs.berkeley.edu/~russell/classes/cs194/f11/lectures/CS194%20Fall%202011%20Lecture%2006.pdf) -## Temă +Explorează mai mult matematica din spatele regresiei logistice în [această lecție](https://people.eecs.berkeley.edu/~russell/classes/cs194/f11/lectures/CS194%20Fall%202011%20Lecture%2006.pdf) +## Temă [Studiază solvers](assignment.md) --- -**Declinare de responsabilitate**: -Acest document a fost tradus folosind serviciul de traducere AI [Co-op Translator](https://github.com/Azure/co-op-translator). Deși ne străduim să asigurăm acuratețea, vă rugăm să fiți conștienți că traducerile automate pot conține erori sau inexactități. Documentul original în limba sa natală ar trebui considerat sursa autoritară. Pentru informații critice, se recomandă traducerea profesională realizată de un specialist uman. Nu ne asumăm responsabilitatea pentru eventualele neînțelegeri sau interpretări greșite care pot apărea din utilizarea acestei traduceri. \ No newline at end of file + +**Declinare a responsabilității**: +Acest document a fost tradus utilizând serviciul de traducere AI [Co-op Translator](https://github.com/Azure/co-op-translator). Deși ne străduim pentru acuratețe, vă rugăm să rețineți că traducerile automate pot conține erori sau inexactități. Documentul original în limba sa nativă trebuie considerat sursa autorizată. Pentru informații critice, se recomandă traducerea profesională realizată de un traducător uman. Nu ne asumăm răspunderea pentru eventualele neînțelegeri sau interpretări greșite rezultate din utilizarea acestei traduceri. + \ No newline at end of file diff --git a/translations/ro/README.md b/translations/ro/README.md index 2acbd573d..d36daf8b3 100644 --- a/translations/ro/README.md +++ b/translations/ro/README.md @@ -8,16 +8,16 @@ [![GitHub forks](https://img.shields.io/github/forks/microsoft/ML-For-Beginners.svg?style=social&label=Fork)](https://GitHub.com/microsoft/ML-For-Beginners/network/) [![GitHub stars](https://img.shields.io/github/stars/microsoft/ML-For-Beginners.svg?style=social&label=Star)](https://GitHub.com/microsoft/ML-For-Beginners/stargazers/) -### 🌐 Suport Multilingv +### 🌐 Suport multilingv -#### Susținut prin GitHub Action (Automatizat & Întotdeauna Actualizat) +#### Sprijinit prin GitHub Action (automatizat și mereu actualizat) -[Arabic](../ar/README.md) | [Bengali](../bn/README.md) | [Bulgaria](../bg/README.md) | [Burmese (Myanmar)](../my/README.md) | [Chinese (Simplified)](../zh-CN/README.md) | [Chinese (Traditional, Hong Kong)](../zh-HK/README.md) | [Chinese (Traditional, Macau)](../zh-MO/README.md) | [Chinese (Traditional, Taiwan)](../zh-TW/README.md) | [Croatian](../hr/README.md) | [Czech](../cs/README.md) | [Danish](../da/README.md) | [Dutch](../nl/README.md) | [Estonian](../et/README.md) | [Finnish](../fi/README.md) | [French](../fr/README.md) | [German](../de/README.md) | [Greek](../el/README.md) | [Hebrew](../he/README.md) | [Hindi](../hi/README.md) | [Hungarian](../hu/README.md) | [Indonesian](../id/README.md) | [Italian](../it/README.md) | [Japanese](../ja/README.md) | [Kannada](../kn/README.md) | [Khmer](../km/README.md) | [Korean](../ko/README.md) | [Lithuanian](../lt/README.md) | [Malay](../ms/README.md) | [Malayalam](../ml/README.md) | [Marathi](../mr/README.md) | [Nepali](../ne/README.md) | [Nigerian Pidgin](../pcm/README.md) | [Norwegian](../no/README.md) | [Persian (Farsi)](../fa/README.md) | [Polish](../pl/README.md) | [Portuguese (Brazil)](../pt-BR/README.md) | [Portuguese (Portugal)](../pt-PT/README.md) | [Punjabi (Gurmukhi)](../pa/README.md) | [Romanian](./README.md) | [Russian](../ru/README.md) | [Serbian (Cyrillic)](../sr/README.md) | [Slovak](../sk/README.md) | [Slovenian](../sl/README.md) | [Spanish](../es/README.md) | [Swahili](../sw/README.md) | [Swedish](../sv/README.md) | [Tagalog (Filipino)](../tl/README.md) | [Tamil](../ta/README.md) | [Telugu](../te/README.md) | [Thai](../th/README.md) | [Turkish](../tr/README.md) | [Ukrainian](../uk/README.md) | [Urdu](../ur/README.md) | [Vietnamese](../vi/README.md) +[Arabă](../ar/README.md) | [Bengali](../bn/README.md) | [Bulgară](../bg/README.md) | [Birmană (Myanmar)](../my/README.md) | [Chineză (simplificată)](../zh-CN/README.md) | [Chineză (tradițională, Hong Kong)](../zh-HK/README.md) | [Chineză (tradițională, Macau)](../zh-MO/README.md) | [Chineză (tradițională, Taiwan)](../zh-TW/README.md) | [Croată](../hr/README.md) | [Cehă](../cs/README.md) | [Daneză](../da/README.md) | [Olandeză](../nl/README.md) | [Estoniană](../et/README.md) | [Finlandeză](../fi/README.md) | [Franceză](../fr/README.md) | [Germană](../de/README.md) | [Greacă](../el/README.md) | [Ebraică](../he/README.md) | [Hindi](../hi/README.md) | [Maghiară](../hu/README.md) | [Indoneziană](../id/README.md) | [Italiană](../it/README.md) | [Japoneză](../ja/README.md) | [Kannada](../kn/README.md) | [Khmer](../km/README.md) | [Coreeană](../ko/README.md) | [Lituaniană](../lt/README.md) | [Malaysiană](../ms/README.md) | [Malayalam](../ml/README.md) | [Marathi](../mr/README.md) | [Nepaleză](../ne/README.md) | [Pidgin Nigerian](../pcm/README.md) | [Norvegiană](../no/README.md) | [Persană (Farsi)](../fa/README.md) | [Poloneză](../pl/README.md) | [Portugheză (Brazilia)](../pt-BR/README.md) | [Portugheză (Portugalia)](../pt-PT/README.md) | [Punjabi (Gurmukhi)](../pa/README.md) | [Română](./README.md) | [Rusă](../ru/README.md) | [Sârbă (chirilică)](../sr/README.md) | [Slovacă](../sk/README.md) | [Sloveniă](../sl/README.md) | [Spaniolă](../es/README.md) | [Swahili](../sw/README.md) | [Suedeză](../sv/README.md) | [Tagalog (Filipino)](../tl/README.md) | [Tamil](../ta/README.md) | [Telugu](../te/README.md) | [Thailandeză](../th/README.md) | [Turcă](../tr/README.md) | [Ucraineană](../uk/README.md) | [Urdu](../ur/README.md) | [Vietnameză](../vi/README.md) -> **Preferi să Clonezi Local?** +> **Preferi să clonezi local?** > -> Acest depozit include peste 50 de traduceri în diferite limbi, ceea ce crește semnificativ dimensiunea descărcării. Pentru a clona fără traduceri, folosește sparse checkout: +> Acest depozit include peste 50 de traduceri care cresc semnificativ dimensiunea descărcării. Pentru a clona fără traduceri, folosește sparse checkout: > > **Bash / macOS / Linux:** > ```bash @@ -33,158 +33,158 @@ > git sparse-checkout set --no-cone "/*" "!translations" "!translated_images" > ``` > -> Astfel obții tot ce ai nevoie pentru a finaliza cursul cu o descărcare mult mai rapidă. +> Acest lucru îți oferă tot ce ai nevoie pentru a urma cursul cu o descărcare mult mai rapidă. -#### Alătură-te Comunității Noastre +#### Alătură-te comunității noastre [![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG) -Avem o serie de învățare pe Discord despre AI în desfășurare, află mai multe și alătură-te nouă la [Learn with AI Series](https://aka.ms/learnwithai/discord) în perioada 18 - 30 septembrie 2025. Vei primi sfaturi și trucuri despre utilizarea GitHub Copilot pentru Data Science. +Avem o serie Discord „Learn with AI” în curs, află mai multe și alătură-te la [Learn with AI Series](https://aka.ms/learnwithai/discord) între 18 - 30 septembrie 2025. Vei primi sfaturi și trucuri pentru utilizarea GitHub Copilot în Data Science. -![Learn with AI series](../../translated_images/ro/3.9b58fd8d6c373c20.webp) +![Seria Learn with AI](../../translated_images/ro/3.9b58fd8d6c373c20.webp) -# Învățare Automată pentru Începători - Un Curriculum +# Machine Learning pentru Începători – Un Curriculum -> 🌍 Călătorește în jurul lumii în timp ce explorăm Învățarea Automată prin culturi ale lumii 🌍 +> 🌍 Călătorește în jurul lumii explorând Machine Learning prin prisma culturilor mondiale 🌍 -Cloud Advocates de la Microsoft sunt încântați să ofere un curriculum de 12 săptămâni, 26 de lecții, complet dedicat **Învățării Automate**. În acest curriculum, vei învăța despre ceea ce se numește uneori **învățare automată clasică**, folosind în principal Scikit-learn ca bibliotecă și evitând învățarea profundă, care este acoperită în curriculumul nostru [AI pentru Începători](https://aka.ms/ai4beginners). Combină aceste lecții cu curriculumul nostru ['Data Science pentru Începători'](https://aka.ms/ds4beginners) totodată! +Advocații Cloud de la Microsoft sunt încântați să ofere un curriculum de 12 săptămâni, 26 de lecții, totul despre **Machine Learning**. În acest curriculum, vei învăța despre ceea ce se numește uneori **machine learning clasic**, folosind în principal biblioteca Scikit-learn și evitând deep learning-ul, care este acoperit în curriculumul nostru [AI pentru Începători](https://aka.ms/ai4beginners). Combină aceste lecții cu curriculumul nostru ['Data Science pentru Începători'](https://aka.ms/ds4beginners)! -Călătorește alături de noi în jurul lumii aplicând aceste tehnici clasice pe date din diverse regiuni ale globului. Fiecare lecție include chestionare pre și post-lectură, instrucțiuni scrise pentru completarea lecției, o soluție, o temă și multe altele. Pedagogia noastră bazată pe proiecte îți permite să înveți construind, o metodă dovedită pentru a fixa noile cunoștințe. +Călătorește cu noi în jurul lumii aplicând aceste tehnici clasice pe date din diverse regiuni ale lumii. Fiecare lecție include chestionare înainte și după lecție, instrucțiuni scrise pentru completarea lecției, o soluție, o temă și multe altele. Pedagogia noastră bazată pe proiecte îți permite să înveți construind, o metodă dovedită pentru a fixa noile cunoștințe. -**✍️ Mulțumiri călduroase autorilor noștri** Jen Looper, Stephen Howell, Francesca Lazzeri, Tomomi Imura, Cassie Breviu, Dmitry Soshnikov, Chris Noring, Anirban Mukherjee, Ornella Altunyan, Ruth Yakubu și Amy Boyd +**✍️ Mulțumiri sincere autorilor noștri** Jen Looper, Stephen Howell, Francesca Lazzeri, Tomomi Imura, Cassie Breviu, Dmitry Soshnikov, Chris Noring, Anirban Mukherjee, Ornella Altunyan, Ruth Yakubu și Amy Boyd -**🎨 Mulțumiri de asemenea ilustratorilor noștri** Tomomi Imura, Dasani Madipalli și Jen Looper +**🎨 Mulțumiri și ilustratorilor noștri** Tomomi Imura, Dasani Madipalli și Jen Looper -**🙏 Mulțumiri speciale 🙏 ambasadorilor studenți Microsoft autori, recenzori și contribuitori de conținut**, în special Rishit Dagli, Muhammad Sakib Khan Inan, Rohan Raj, Alexandru Petrescu, Abhishek Jaiswal, Nawrin Tabassum, Ioan Samuila și Snigdha Agarwal +**🙏 Mulțumiri speciale 🙏 autorilor, recenzorilor și colaboratorilor de conținut Microsoft Student Ambassador**, în special Rishit Dagli, Muhammad Sakib Khan Inan, Rohan Raj, Alexandru Petrescu, Abhishek Jaiswal, Nawrin Tabassum, Ioan Samuila și Snigdha Agarwal -**🤩 Mulțumiri suplimentare ambasadorilor studenți Microsoft Eric Wanjau, Jasleen Sondhi și Vidushi Gupta pentru lecțiile R!** +**🤩 Mulțumiri suplimentare Microsoft Student Ambassadors Eric Wanjau, Jasleen Sondhi și Vidushi Gupta pentru lecțiile R!** -# Începeți +# Începe aici -Urmați acești pași: -1. **Fă o Fork a Repozitoriului**: Apasă pe butonul "Fork" din colțul din dreapta sus al acestei pagini. -2. **Clonează Repozitoriul**: `git clone https://github.com/microsoft/ML-For-Beginners.git` +Urmează acești pași: +1. **Fă fork la depozit**: Apasă butonul „Fork” din colțul dreapta sus al acestei pagini. +2. **Clonează depozitul**: `git clone https://github.com/microsoft/ML-For-Beginners.git` > [găsește toate resursele suplimentare pentru acest curs în colecția noastră Microsoft Learn](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) -> 🔧 **Ai nevoie de ajutor?** Consultă [Ghidul de depanare](TROUBLESHOOTING.md) pentru soluții la probleme comune cu instalarea, configurarea și rularea lecțiilor. +> 🔧 **Ai nevoie de ajutor?** Consultă [Ghidul nostru de depanare](TROUBLESHOOTING.md) pentru soluții la probleme comune privind instalarea, configurarea și rularea lecțiilor. -**[Studenți](https://aka.ms/student-page)**, pentru a folosi acest curriculum, fă fork la întregul repo pe contul tău GitHub și realizează exercițiile singur sau în grup: +**[Studenți](https://aka.ms/student-page)**, pentru a folosi acest curriculum, faceți fork întregului depozit în contul vostru GitHub și completați exercițiile singuri sau în grup: -- Începe cu un chestionar înainte de lectură. -- Citește lecția și completează activitățile, oprindu-te și reflectând la fiecare verificare a cunoștințelor. -- Încearcă să creezi proiectele înțelegând lecțiile mai degrabă decât rulând codul soluției; totuși codul este disponibil în folderele `/solution` din fiecare lecție orientată spre proiect. -- Dă chestionarul după lectură. -- Completează provocarea. -- Realizează tema. -- După finalizarea unui grup de lecții, vizitează [Discuțiile](https://github.com/microsoft/ML-For-Beginners/discussions) și "învăță cu voce tare" completând rubricile PAT corespunzătoare. Un 'PAT' este un Instrument de Evaluare a Progresului pe care îl completezi pentru a-ți aprofunda învățarea. Poți, de asemenea, să reacționezi la alți PAT-uri ca să învățăm împreună. +- Începeți cu un chestionar pre-lectură. +- Citiți lecția și finalizați activitățile, oprindu-vă și reflectând la fiecare verificare de cunoștințe. +- Încercați să creați proiectele înțelegând lecțiile, mai degrabă decât să rulați codul soluției; codul soluției este disponibil însă în folderele `/solution` pentru fiecare lecție orientată pe proiect. +- Faceți chestionarul post-lectură. +- Finalizați provocarea. +- Finalizați tema. +- După ce terminați un grup de lecții, vizitați [Forum de Discuții](https://github.com/microsoft/ML-For-Beginners/discussions) și „învățați cu voce tare” completând rubrica PAT corespunzătoare. Un 'PAT' este un instrument de evaluare a progresului ce completezi pentru a-ți aprofunda învățarea. Poți reacționa și la alte PAT-uri pentru a învăța împreună. -> Pentru studiu suplimentar, recomandăm urmarea acestor module și căi de învățare [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/k7o7tg1gp306q4?WT.mc_id=academic-77952-leestott). +> Pentru studiu suplimentar, vă recomandăm să urmați aceste module și căi de învățare [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/k7o7tg1gp306q4?WT.mc_id=academic-77952-leestott). -**Profesori**, am inclus [câteva sugestii](for-teachers.md) despre cum să folosești acest curriculum. +**Profesori**, am inclus [unele sugestii](for-teachers.md) despre cum să utilizați acest curriculum. --- ## Prezentări video -Unele lecții sunt disponibile sub formă de video-uri scurte. Le poți găsi în linie în lecții, sau pe [playlist-ul ML for Beginners de pe canalul Microsoft Developer YouTube](https://aka.ms/ml-beginners-videos) făcând clic pe imaginea de mai jos. +Unele lecții sunt disponibile ca video-uri scurte. Le puteți găsi integrate în lecții sau pe [playlist-ul ML for Beginners pe canalul Microsoft Developer YouTube](https://aka.ms/ml-beginners-videos) dând clic pe imaginea de mai jos. -[![ML for beginners banner](../../translated_images/ro/ml-for-beginners-video-banner.63f694a100034bc6.webp)](https://aka.ms/ml-beginners-videos) +[![Banner ML for beginners](../../translated_images/ro/ml-for-beginners-video-banner.63f694a100034bc6.webp)](https://aka.ms/ml-beginners-videos) --- ## Echipa -[![Promo video](../../images/ml.gif)](https://youtu.be/Tj1XWrDSYJU) +[![Video promoțional](../../images/ml.gif)](https://youtu.be/Tj1XWrDSYJU) -**Gif de** [Mohit Jaisal](https://linkedin.com/in/mohitjaisal) +**Gif realizat de** [Mohit Jaisal](https://linkedin.com/in/mohitjaisal) -> 🎥 Fă clic pe imaginea de mai sus pentru un videoclip despre proiect și despre persoanele care l-au creat! +> 🎥 Dă clic pe imaginea de mai sus pentru un video despre proiect și oamenii care l-au creat! --- ## Pedagogie -Am ales două principii pedagogice în crearea acestui curriculum: să fie practic **bazat pe proiecte** și să includă **chestionare frecvente**. În plus, acest curriculum are o **temă** comună pentru a-i oferi coeziune. +Am ales două principii pedagogice în construirea acestui curriculum: asigurarea faptului că este practic, bazat pe **proiecte**, și că include **teste frecvente**. În plus, acest curriculum are o **temă** comună pentru a-i conferi coeziune. -Asigurând alinierea conținutului cu proiectele, procesul devine mai captivant pentru studenți și retenția conceptelor este augmentată. În plus, un chestionar cu miză scăzută înainte de clasă setează intenția studentului către învățarea unui subiect, iar un al doilea chestionar după clasă asigură retenția ulterioară. Acest curriculum a fost conceput să fie flexibil și distractiv și poate fi parcurs integral sau parțial. Proiectele încep mici și devin tot mai complexe până la finalul ciclului de 12 săptămâni. Curriculumul include, de asemenea, un postscript despre aplicațiile reale ale ML, care poate fi folosit ca credit suplimentar sau ca bază pentru discuție. +Prin alinierea conținutului la proiecte, procesul devine mai captivant pentru studenți și reținerea conceptelor este îmbunătățită. În plus, un chestionar cu miză mică înaintea unei lecții setează intenția studentului de a învăța un subiect, în timp ce un al doilea chestionar după lecție asigură o retenție suplimentară. Acest curriculum a fost proiectat să fie flexibil și distractiv și poate fi urmat integral sau parțial. Proiectele încep mici și devin din ce în ce mai complexe până la finalul ciclului de 12 săptămâni. Curriculumul include și un postscriptum despre aplicațiile ML în lumea reală, care poate fi folosit ca credit suplimentar sau ca bază pentru discuții. -> Găsește regulile noastre în [Codul de conduită](CODE_OF_CONDUCT.md), [Contribuția](CONTRIBUTING.md), [Traduceri](..) și [Depanare](TROUBLESHOOTING.md). Apreciem feedbackul tău constructiv! +> Găsiți [Codul nostru de conduită](CODE_OF_CONDUCT.md), [Contribuții](CONTRIBUTING.md), [Traduceri](..) și [Ghidul de depanare](TROUBLESHOOTING.md). Așteptăm cu interes feedback-ul vostru constructiv! ## Fiecare lecție include -- sketchnote opțional +- schiță opțională - video suplimentar opțional -- prezentare video (doar la unele lecții) +- prezentare video (doar unele lecții) - [chestionar de încălzire pre-lectură](https://ff-quizzes.netlify.app/en/ml/) - lecție scrisă -- pentru lecțiile bazate pe proiect, ghiduri pas cu pas pentru construirea proiectului -- verificări de cunoștințe +- pentru lecțiile bazate pe proiecte, ghid pas cu pas pentru construire proiect +- verificări ale cunoștințelor - o provocare -- lectură suplimentară +- lecturi suplimentare - temă - [chestionar post-lectură](https://ff-quizzes.netlify.app/en/ml/) -> **O notă despre limbi**: Aceste lecții sunt scrise în principal în Python, dar multe sunt disponibile și în R. Pentru a finaliza o lecție în R, accesați folderul `/solution` și căutați lecțiile în R. Acestea includ o extensie .rmd care reprezintă un fișier **R Markdown**, care poate fi definit simplu ca o încorporare de `bucăți de cod` (în R sau alte limbi) și un `antet YAML` (care ghidează modul de a formata ieșirile, precum PDF) într-un `document Markdown`. Ca atare, servește ca un cadru exemplu pentru autorat în știința datelor deoarece vă permite să combinați codul dvs., rezultatele sale și gândurile dvs., permițându-vă să le scrieți în Markdown. Mai mult, documentele R Markdown pot fi redate în formate de ieșire precum PDF, HTML sau Word. - -> **O notă despre chestionare**: Toate chestionarele sunt conținute în [folderul Quiz App](../../quiz-app), în total 52 de chestionare a câte trei întrebări fiecare. Sunt legate din interiorul lecțiilor, dar aplicația de chestionare poate fi rulată local; urmați instrucțiunile din folderul `quiz-app` pentru a găzdui local sau a implementa pe Azure. - -| Număr Lecție | Subiect | Grupare Lecții | Obiective de învățare | Lecția legată | Autor | -| :-----------: | :------------------------------------------------------------: | :-------------------------------------------------: | ------------------------------------------------------------------------------------------------------------------------------- | :--------------------------------------------------------------------------------------------------------------------------------------: | :--------------------------------------------------: | -| 01 | Introducere în învățarea automată | [Introducere](1-Introduction/README.md) | Învață conceptele de bază din spatele învățării automate | [Lecție](1-Introduction/1-intro-to-ML/README.md) | Muhammad | -| 02 | Istoria învățării automate | [Introducere](1-Introduction/README.md) | Învață istoria domeniului | [Lecție](1-Introduction/2-history-of-ML/README.md) | Jen și Amy | -| 03 | Echitatea și învățarea automată | [Introducere](1-Introduction/README.md) | Care sunt problemele filosofice importante privind echitatea pe care studenții trebuie să le ia în considerare când construiesc și aplică modele ML? | [Lecție](1-Introduction/3-fairness/README.md) | Tomomi | -| 04 | Tehnici pentru învățarea automată | [Introducere](1-Introduction/README.md) | Ce tehnici folosesc cercetătorii ML pentru a crea modele ML? | [Lecție](1-Introduction/4-techniques-of-ML/README.md) | Chris și Jen | -| 05 | Introducere în regresie | [Regresie](2-Regression/README.md) | Începe cu Python și Scikit-learn pentru modelele de regresie | [Python](2-Regression/1-Tools/README.md) • [R](../../2-Regression/1-Tools/solution/R/lesson_1.html) | Jen • Eric Wanjau | -| 06 | Prețurile dovlecilor din America de Nord 🎃 | [Regresie](2-Regression/README.md) | Vizualizează și curăță datele în pregătirea pentru ML | [Python](2-Regression/2-Data/README.md) • [R](../../2-Regression/2-Data/solution/R/lesson_2.html) | Jen • Eric Wanjau | -| 07 | Prețurile dovlecilor din America de Nord 🎃 | [Regresie](2-Regression/README.md) | Construiți modele de regresie liniară și polinomială | [Python](2-Regression/3-Linear/README.md) • [R](../../2-Regression/3-Linear/solution/R/lesson_3.html) | Jen și Dmitry • Eric Wanjau | -| 08 | Prețurile dovlecilor din America de Nord 🎃 | [Regresie](2-Regression/README.md) | Construiți un model de regresie logistică | [Python](2-Regression/4-Logistic/README.md) • [R](../../2-Regression/4-Logistic/solution/R/lesson_4.html) | Jen • Eric Wanjau | -| 09 | O aplicație web 🔌 | [Aplicație web](3-Web-App/README.md) | Construiți o aplicație web pentru a utiliza modelul antrenat | [Python](3-Web-App/1-Web-App/README.md) | Jen | -| 10 | Introducere în clasificare | [Clasificare](4-Classification/README.md) | Curăță, pregătește și vizualizează datele; introducere în clasificare | [Python](4-Classification/1-Introduction/README.md) • [R](../../4-Classification/1-Introduction/solution/R/lesson_10.html) | Jen și Cassie • Eric Wanjau | -| 11 | Bucătării delicioase din Asia și India 🍜 | [Clasificare](4-Classification/README.md) | Introducere în clasificatoare | [Python](4-Classification/2-Classifiers-1/README.md) • [R](../../4-Classification/2-Classifiers-1/solution/R/lesson_11.html) | Jen și Cassie • Eric Wanjau | -| 12 | Bucătării delicioase din Asia și India 🍜 | [Clasificare](4-Classification/README.md) | Mai multe clasificatoare | [Python](4-Classification/3-Classifiers-2/README.md) • [R](../../4-Classification/3-Classifiers-2/solution/R/lesson_12.html) | Jen și Cassie • Eric Wanjau | -| 13 | Bucătării delicioase din Asia și India 🍜 | [Clasificare](4-Classification/README.md) | Construiți o aplicație web recomandatoare folosind modelul dvs. | [Python](4-Classification/4-Applied/README.md) | Jen | -| 14 | Introducere în clustering | [Clustering](5-Clustering/README.md) | Curăță, pregătește și vizualizează datele; Introducere în clustering | [Python](5-Clustering/1-Visualize/README.md) • [R](../../5-Clustering/1-Visualize/solution/R/lesson_14.html) | Jen • Eric Wanjau | -| 15 | Explorarea gusturilor muzicale nigeriene 🎧 | [Clustering](5-Clustering/README.md) | Explorează metoda de clustering K-Means | [Python](5-Clustering/2-K-Means/README.md) • [R](../../5-Clustering/2-K-Means/solution/R/lesson_15.html) | Jen • Eric Wanjau | -| 16 | Introducere în procesarea limbajului natural ☕️ | [Procesare limbaj natural](6-NLP/README.md) | Învață elementele de bază despre NLP construind un bot simplu | [Python](6-NLP/1-Introduction-to-NLP/README.md) | Stephen | -| 17 | Sarcini comune în NLP ☕️ | [Procesare limbaj natural](6-NLP/README.md) | Adâncește-ți cunoștințele despre NLP înțelegând sarcinile comune necesare pentru a gestiona structurile limbajului | [Python](6-NLP/2-Tasks/README.md) | Stephen | -| 18 | Traducere și analiza sentimentelor ♥️ | [Procesare limbaj natural](6-NLP/README.md) | Traducere și analiza sentimentelor cu Jane Austen | [Python](6-NLP/3-Translation-Sentiment/README.md) | Stephen | -| 19 | Hoteluri romantice din Europa ♥️ | [Procesare limbaj natural](6-NLP/README.md) | Analiza sentimentului cu recenzii de hotel 1 | [Python](6-NLP/4-Hotel-Reviews-1/README.md) | Stephen | -| 20 | Hoteluri romantice din Europa ♥️ | [Procesare limbaj natural](6-NLP/README.md) | Analiza sentimentului cu recenzii de hotel 2 | [Python](6-NLP/5-Hotel-Reviews-2/README.md) | Stephen | -| 21 | Introducere în prognoza seriilor temporale | [Serii temporale](7-TimeSeries/README.md) | Introducere în prognoza seriilor temporale | [Python](7-TimeSeries/1-Introduction/README.md) | Francesca | -| 22 | ⚡️ Utilizarea puterii mondiale ⚡️ - prognoza seriilor cu ARIMA | [Serii temporale](7-TimeSeries/README.md) | Prognoza seriilor temporale cu ARIMA | [Python](7-TimeSeries/2-ARIMA/README.md) | Francesca | -| 23 | ⚡️ Utilizarea puterii mondiale ⚡️ - prognoza seriilor cu SVR | [Serii temporale](7-TimeSeries/README.md) | Prognoza seriilor temporale cu regresor vector suport (Support Vector Regressor) | [Python](7-TimeSeries/3-SVR/README.md) | Anirban | -| 24 | Introducere în învățarea prin întărire | [Învățare prin întărire](8-Reinforcement/README.md) | Introducere în învățarea prin întărire utilizând Q-Learning | [Python](8-Reinforcement/1-QLearning/README.md) | Dmitry | -| 25 | Ajută-l pe Peter să evite lupul! 🐺 | [Învățare prin întărire](8-Reinforcement/README.md) | Învățare prin întărire Gym | [Python](8-Reinforcement/2-Gym/README.md) | Dmitry | -| Postscript | Scenarii și aplicații ML din lumea reală | [ML în natură](9-Real-World/README.md) | Aplicații reale interesante și revelatoare ale ML clasice | [Lecție](9-Real-World/1-Applications/README.md) | Echipa | -| Postscript | Debugging-ul modelelor în ML folosind RAI dashboard | [ML în natură](9-Real-World/README.md) | Debugging în învățarea automată folosind componentele dashboard-ului Responsible AI | [Lecție](9-Real-World/2-Debugging-ML-Models/README.md) | Ruth Yakubu | +> **O notă despre limbi**: Aceste lecții sunt scrise în principal în Python, dar multe sunt disponibile și în R. Pentru a finaliza o lecție în R, accesați folderul `/solution` și căutați lecții în R. Acestea includ o extensie .rmd care reprezintă un fișier **R Markdown**, definit simplu ca o încorporare de `blocuri de cod` (în R sau alte limbi) și un `antet YAML` (care ghidează modul de formatare a ieșirilor, precum PDF) într-un `document Markdown`. Astfel, servește ca un cadru exemplu de creare pentru știința datelor, deoarece vă permite să combinați codul, rezultatul său și gândurile dvs., permițându-vă să le scrieți în Markdown. Mai mult, documentele R Markdown pot fi redate în formate de ieșire precum PDF, HTML sau Word. + +> **O notă despre teste**: Toate testele se găsesc în [folderul Quiz App](../../quiz-app), în total 52 de teste a câte trei întrebări fiecare. Sunt legate din interiorul lecțiilor, dar aplicația de teste poate fi rulată local; urmați instrucțiunile din folderul `quiz-app` pentru a găzdui local sau a implementa pe Azure. + +| Numărul lecției | Subiect | Gruparea lecției | Obiective de învățare | Lecția legată | Autor | +| :-------------: | :-------------------------------------------------------------: | :-------------------------------------------------: | ------------------------------------------------------------------------------------------------------------------------------- | :--------------------------------------------------------------------------------------------------------------------------------------: | :----------------------------------------------------: | +| 01 | Introducere în învățarea automată | [Introducere](1-Introduction/README.md) | Învață conceptele de bază din spatele învățării automate | [Lecția](1-Introduction/1-intro-to-ML/README.md) | Muhammad | +| 02 | Istoria învățării automate | [Introducere](1-Introduction/README.md) | Învață istoria domeniului | [Lecția](1-Introduction/2-history-of-ML/README.md) | Jen și Amy | +| 03 | Corectitudine și învățarea automată | [Introducere](1-Introduction/README.md) | Care sunt problemele filozofice importante legate de corectitudine pe care studenții ar trebui să le ia în considerare când construiesc și aplică modele ML? | [Lecția](1-Introduction/3-fairness/README.md) | Tomomi | +| 04 | Tehnici pentru învățarea automată | [Introducere](1-Introduction/README.md) | Ce tehnici folosesc cercetătorii ML pentru a construi modele ML? | [Lecția](1-Introduction/4-techniques-of-ML/README.md) | Chris și Jen | +| 05 | Introducere în regresie | [Regresie](2-Regression/README.md) | Începeți cu Python și Scikit-learn pentru modele de regresie | [Python](2-Regression/1-Tools/README.md) • [R](../../2-Regression/1-Tools/solution/R/lesson_1.html) | Jen • Eric Wanjau | +| 06 | Prețurile dovlecilor din America de Nord 🎃 | [Regresie](2-Regression/README.md) | Vizualizează și curăță datele în pregătirea pentru ML | [Python](2-Regression/2-Data/README.md) • [R](../../2-Regression/2-Data/solution/R/lesson_2.html) | Jen • Eric Wanjau | +| 07 | Prețurile dovlecilor din America de Nord 🎃 | [Regresie](2-Regression/README.md) | Construiește modele de regresie liniară și polinomială | [Python](2-Regression/3-Linear/README.md) • [R](../../2-Regression/3-Linear/solution/R/lesson_3.html) | Jen și Dmitry • Eric Wanjau | +| 08 | Prețurile dovlecilor din America de Nord 🎃 | [Regresie](2-Regression/README.md) | Construiește un model de regresie logistică | [Python](2-Regression/4-Logistic/README.md) • [R](../../2-Regression/4-Logistic/solution/R/lesson_4.html) | Jen • Eric Wanjau | +| 09 | O aplicație web 🔌 | [Aplicație web](3-Web-App/README.md) | Construiește o aplicație web pentru a folosi modelul antrenat | [Python](3-Web-App/1-Web-App/README.md) | Jen | +| 10 | Introducere în clasificare | [Clasificare](4-Classification/README.md) | Curăță, pregătește și vizualizează datele; introducere în clasificare | [Python](4-Classification/1-Introduction/README.md) • [R](../../4-Classification/1-Introduction/solution/R/lesson_10.html) | Jen și Cassie • Eric Wanjau | +| 11 | Bucătării asiatice și indiene delicioase 🍜 | [Clasificare](4-Classification/README.md) | Introducere în clasificatori | [Python](4-Classification/2-Classifiers-1/README.md) • [R](../../4-Classification/2-Classifiers-1/solution/R/lesson_11.html) | Jen și Cassie • Eric Wanjau | +| 12 | Bucătării asiatice și indiene delicioase 🍜 | [Clasificare](4-Classification/README.md) | Mai mulți clasificatori | [Python](4-Classification/3-Classifiers-2/README.md) • [R](../../4-Classification/3-Classifiers-2/solution/R/lesson_12.html) | Jen și Cassie • Eric Wanjau | +| 13 | Bucătării asiatice și indiene delicioase 🍜 | [Clasificare](4-Classification/README.md) | Construiește o aplicație web de recomandare folosind modelul tău | [Python](4-Classification/4-Applied/README.md) | Jen | +| 14 | Introducere în clustering | [Clustering](5-Clustering/README.md) | Curăță, pregătește și vizualizează datele; introducere în clustering | [Python](5-Clustering/1-Visualize/README.md) • [R](../../5-Clustering/1-Visualize/solution/R/lesson_14.html) | Jen • Eric Wanjau | +| 15 | Explorarea gusturilor muzicale nigeriene 🎧 | [Clustering](5-Clustering/README.md) | Explorează metoda de clustering K-Means | [Python](5-Clustering/2-K-Means/README.md) • [R](../../5-Clustering/2-K-Means/solution/R/lesson_15.html) | Jen • Eric Wanjau | +| 16 | Introducere în procesarea limbajului natural ☕️ | [Procesarea limbajului natural](6-NLP/README.md) | Învață elementele de bază ale NLP construind un bot simplu | [Python](6-NLP/1-Introduction-to-NLP/README.md) | Stephen | +| 17 | Sarcini comune NLP ☕️ | [Procesarea limbajului natural](6-NLP/README.md) | Adâncește-ți cunoștințele în NLP înțelegând sarcinile comune necesare când lucrezi cu structuri ale limbajului | [Python](6-NLP/2-Tasks/README.md) | Stephen | +| 18 | Traducere și analiza sentimentelor ♥️ | [Procesarea limbajului natural](6-NLP/README.md) | Traducere și analiza sentimentelor cu Jane Austen | [Python](6-NLP/3-Translation-Sentiment/README.md) | Stephen | +| 19 | Hoteluri romantice din Europa ♥️ | [Procesarea limbajului natural](6-NLP/README.md) | Analiza sentimentelor cu recenzii la hoteluri 1 | [Python](6-NLP/4-Hotel-Reviews-1/README.md) | Stephen | +| 20 | Hoteluri romantice din Europa ♥️ | [Procesarea limbajului natural](6-NLP/README.md) | Analiza sentimentelor cu recenzii la hoteluri 2 | [Python](6-NLP/5-Hotel-Reviews-2/README.md) | Stephen | +| 21 | Introducere în prognoza seriilor temporale | [Serii temporale](7-TimeSeries/README.md) | Introducere în prognoza seriilor temporale | [Python](7-TimeSeries/1-Introduction/README.md) | Francesca | +| 22 | ⚡️ Consum mondial de energie ⚡️ - prognoza seriilor temporale cu ARIMA | [Serii temporale](7-TimeSeries/README.md) | Prognoza seriilor temporale cu ARIMA | [Python](7-TimeSeries/2-ARIMA/README.md) | Francesca | +| 23 | ⚡️ Consum mondial de energie ⚡️ - prognoza seriilor temporale cu SVR | [Serii temporale](7-TimeSeries/README.md) | Prognoza seriilor temporale cu Regressorul Vectorial de Suport | [Python](7-TimeSeries/3-SVR/README.md) | Anirban | +| 24 | Introducere în învățarea prin întărire | [Învățare prin întărire](8-Reinforcement/README.md) | Introducere în învățarea prin întărire cu Q-Learning | [Python](8-Reinforcement/1-QLearning/README.md) | Dmitry | +| 25 | Ajută-l pe Peter să evite lupul! 🐺 | [Învățare prin întărire](8-Reinforcement/README.md) | Învață cu Gym pentru învățarea prin întărire | [Python](8-Reinforcement/2-Gym/README.md) | Dmitry | +| Postscript | Scenarii și aplicații ML din lumea reală | [ML în natură](9-Real-World/README.md) | Aplicații interesante și revelatoare din lumea reală a ML clasice | [Lecția](9-Real-World/1-Applications/README.md) | Echipa | +| Postscript | Debugging model în ML folosind dashboard-ul RAI | [ML în natură](9-Real-World/README.md) | Debugging model în învățarea automată folosind componentele dashboard-ului Responsible AI | [Lecția](9-Real-World/2-Debugging-ML-Models/README.md) | Ruth Yakubu | > [găsiți toate resursele suplimentare pentru acest curs în colecția noastră Microsoft Learn](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) ## Acces offline -Puteți rula această documentație offline folosind [Docsify](https://docsify.js.org/#/). Clonați acest depozit, [instalați Docsify](https://docsify.js.org/#/quickstart) pe mașina dvs. locală, apoi în folderul rădăcină al acestui repo, tastați `docsify serve`. Site-ul web va fi servit pe portul 3000 pe localhost-ul dvs.: `localhost:3000`. +Puteți rula această documentație offline folosind [Docsify](https://docsify.js.org/#/). Dați fork acestui repo, [instalați Docsify](https://docsify.js.org/#/quickstart) pe mașina dvs. locală, apoi în folderul rădăcină al acestui repo, tastați `docsify serve`. Website-ul va fi servit pe portul 3000 pe localhost-ul dvs.: `localhost:3000`. ## PDF-uri -Găsiți un pdf al curriculumului cu linkuri [aici](https://microsoft.github.io/ML-For-Beginners/pdf/readme.pdf). +Găsiți un PDF al curriculei cu linkuri [aici](https://microsoft.github.io/ML-For-Beginners/pdf/readme.pdf). -## 🎒 Alte cursuri +## 🎒 Alte cursuri -Echipa noastră produce și alte cursuri! Verificați: +Echipa noastră produce și alte cursuri! Verifică: ### LangChain -[![LangChain4j for Beginners](https://img.shields.io/badge/LangChain4j%20for%20Beginners-22C55E?style=for-the-badge&&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchain4j-for-beginners) -[![LangChain.js for Beginners](https://img.shields.io/badge/LangChain.js%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchainjs-for-beginners?WT.mc_id=m365-94501-dwahlin) -[![LangChain for Beginners](https://img.shields.io/badge/LangChain%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://github.com/microsoft/langchain-for-beginners?WT.mc_id=m365-94501-dwahlin) +[![LangChain4j pentru începători](https://img.shields.io/badge/LangChain4j%20for%20Beginners-22C55E?style=for-the-badge&&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchain4j-for-beginners) +[![LangChain.js pentru începători](https://img.shields.io/badge/LangChain.js%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchainjs-for-beginners?WT.mc_id=m365-94501-dwahlin) +[![LangChain pentru începători](https://img.shields.io/badge/LangChain%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://github.com/microsoft/langchain-for-beginners?WT.mc_id=m365-94501-dwahlin) --- -### Azure / Edge / MCP / Agents -[![AZD for Beginners](https://img.shields.io/badge/AZD%20for%20Beginners-0078D4?style=for-the-badge&labelColor=E5E7EB&color=0078D4)](https://github.com/microsoft/AZD-for-beginners?WT.mc_id=academic-105485-koreyst) -[![Edge AI for Beginners](https://img.shields.io/badge/Edge%20AI%20for%20Beginners-00B8E4?style=for-the-badge&labelColor=E5E7EB&color=00B8E4)](https://github.com/microsoft/edgeai-for-beginners?WT.mc_id=academic-105485-koreyst) +### Azure / Edge / MCP / Agenți +[![AZD pentru începători](https://img.shields.io/badge/AZD%20for%20Beginners-0078D4?style=for-the-badge&labelColor=E5E7EB&color=0078D4)](https://github.com/microsoft/AZD-for-beginners?WT.mc_id=academic-105485-koreyst) +[![Edge AI pentru începători](https://img.shields.io/badge/Edge%20AI%20for%20Beginners-00B8E4?style=for-the-badge&labelColor=E5E7EB&color=00B8E4)](https://github.com/microsoft/edgeai-for-beginners?WT.mc_id=academic-105485-koreyst) [![MCP pentru Începători](https://img.shields.io/badge/MCP%20for%20Beginners-009688?style=for-the-badge&labelColor=E5E7EB&color=009688)](https://github.com/microsoft/mcp-for-beginners?WT.mc_id=academic-105485-koreyst) [![Agenți AI pentru Începători](https://img.shields.io/badge/AI%20Agents%20for%20Beginners-00C49A?style=for-the-badge&labelColor=E5E7EB&color=00C49A)](https://github.com/microsoft/ai-agents-for-beginners?WT.mc_id=academic-105485-koreyst) @@ -198,8 +198,8 @@ Echipa noastră produce și alte cursuri! Verificați: --- -### Învățare de bază -[![ML pentru Începători](https://img.shields.io/badge/ML%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=22C55E)](https://aka.ms/ml-beginners?WT.mc_id=academic-105485-koreyst) +### Învățare de Bază +[![Învățare Automată pentru Începători](https://img.shields.io/badge/ML%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=22C55E)](https://aka.ms/ml-beginners?WT.mc_id=academic-105485-koreyst) [![Știința Datelor pentru Începători](https://img.shields.io/badge/Data%20Science%20for%20Beginners-84CC16?style=for-the-badge&labelColor=E5E7EB&color=84CC16)](https://aka.ms/datascience-beginners?WT.mc_id=academic-105485-koreyst) [![AI pentru Începători](https://img.shields.io/badge/AI%20for%20Beginners-A3E635?style=for-the-badge&labelColor=E5E7EB&color=A3E635)](https://aka.ms/ai-beginners?WT.mc_id=academic-105485-koreyst) [![Securitate Cibernetică pentru Începători](https://img.shields.io/badge/Cybersecurity%20for%20Beginners-F97316?style=for-the-badge&labelColor=E5E7EB&color=F97316)](https://github.com/microsoft/Security-101?WT.mc_id=academic-96948-sayoung) @@ -210,29 +210,40 @@ Echipa noastră produce și alte cursuri! Verificați: --- ### Seria Copilot -[![Copilot pentru Programare AI Asistată](https://img.shields.io/badge/Copilot%20for%20AI%20Paired%20Programming-FACC15?style=for-the-badge&labelColor=E5E7EB&color=FACC15)](https://aka.ms/GitHubCopilotAI?WT.mc_id=academic-105485-koreyst) +[![Copilot pentru Programare Asistată de AI](https://img.shields.io/badge/Copilot%20for%20AI%20Paired%20Programming-FACC15?style=for-the-badge&labelColor=E5E7EB&color=FACC15)](https://aka.ms/GitHubCopilotAI?WT.mc_id=academic-105485-koreyst) [![Copilot pentru C#/.NET](https://img.shields.io/badge/Copilot%20for%20C%23/.NET-FBBF24?style=for-the-badge&labelColor=E5E7EB&color=FBBF24)](https://github.com/microsoft/mastering-github-copilot-for-dotnet-csharp-developers?WT.mc_id=academic-105485-koreyst) -[![Aventura Copilot](https://img.shields.io/badge/Copilot%20Adventure-FDE68A?style=for-the-badge&labelColor=E5E7EB&color=FDE68A)](https://github.com/microsoft/CopilotAdventures?WT.mc_id=academic-105485-koreyst) +[![Aventură Copilot](https://img.shields.io/badge/Copilot%20Adventure-FDE68A?style=for-the-badge&labelColor=E5E7EB&color=FDE68A)](https://github.com/microsoft/CopilotAdventures?WT.mc_id=academic-105485-koreyst) ## Obținerea Ajutorului -Dacă întâmpini dificultăți sau ai întrebări despre construirea aplicațiilor AI, alătură-te altor cursanți și dezvoltatori experimentați în discuții despre MCP. Este o comunitate suportivă unde întrebările sunt binevenite și cunoștințele sunt împărtășite liber. +Dacă întâmpini dificultăți sau ai întrebări în timp ce înveți Machine Learning sau construiești aplicații AI, nu te îngrijora — ajutorul este disponibil. -[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG) +Poți participa la discuții cu alți cursanți și dezvoltatori, pune întrebări și împărtăși ideile tale cu comunitatea. + +- Alătură-te comunității pentru a pune întrebări și a învăța împreună cu alții +- Discută concepte de Machine Learning și idei de proiecte +- Primește îndrumare de la dezvoltatori experimentați + +O comunitate suportivă este o modalitate excelentă de a-ți dezvolta abilitățile și de a rezolva probleme mai rapid. -Dacă ai feedback despre produs sau întâmpini erori în timpul dezvoltării vizitează: +[Microsoft Foundry Discord Community](https://discord.gg/nTYy5BXMWG) + +Dacă întâlnești erori, bug-uri sau ai sugestii de îmbunătățire, poți deschide și un **Issue** în acest depozit pentru a raporta problema. + +Pentru feedback despre produs sau pentru a căuta postări existente în comunitate, vizitează Forumul Dezvoltatorilor: [![Microsoft Foundry Developer Forum](https://img.shields.io/badge/GitHub-Microsoft_Foundry_Developer_Forum-blue?style=for-the-badge&logo=github&color=000000&logoColor=fff)](https://aka.ms/foundry/forum) + ## Sfaturi Suplimentare pentru Învățare - Revizuiește caietele după fiecare lecție pentru o înțelegere mai bună. - Exersează implementarea algoritmilor pe cont propriu. -- Explorează seturi reale de date folosind conceptele învățate. +- Explorează seturi de date din lumea reală folosind conceptele învățate. --- **Declinare a responsabilității**: -Acest document a fost tradus folosind serviciul de traducere AI [Co-op Translator](https://github.com/Azure/co-op-translator). Deși ne străduim pentru acuratețe, vă rugăm să fiți conștienți că traducerile automate pot conține erori sau inexactități. Documentul original în limba sa nativă trebuie considerat sursa autorizată. Pentru informații critice, se recomandă traducerea profesională realizată de un specialist uman. Nu ne asumăm răspunderea pentru orice neînțelegeri sau interpretări greșite care pot apărea ca urmare a utilizării acestei traduceri. +Acest document a fost tradus folosind serviciul de traducere AI [Co-op Translator](https://github.com/Azure/co-op-translator). Deși ne străduim pentru acuratețe, vă rugăm să fiți conștienți că traducerile automate pot conține erori sau inexactități. Documentul original în limba sa nativă trebuie considerat sursa autoritară. Pentru informații critice, se recomandă traducerea profesională umană. Nu ne asumăm răspunderea pentru eventuale neînțelegeri sau interpretări greșite rezultate din utilizarea acestei traduceri. \ No newline at end of file diff --git a/translations/sk/.co-op-translator.json b/translations/sk/.co-op-translator.json index 181944788..0f9595407 100644 --- a/translations/sk/.co-op-translator.json +++ b/translations/sk/.co-op-translator.json @@ -90,8 +90,8 @@ "language_code": "sk" }, "2-Regression/3-Linear/README.md": { - "original_hash": "9a8359f1945bd3beccccb2b46592580e", - "translation_date": "2026-02-28T10:20:00+00:00", + "original_hash": "26c53a922f1f1e8542b0ea41ff52221a", + "translation_date": "2026-04-20T20:32:38+00:00", "source_file": "2-Regression/3-Linear/README.md", "language_code": "sk" }, @@ -168,8 +168,8 @@ "language_code": "sk" }, "4-Classification/2-Classifiers-1/README.md": { - "original_hash": "1a6e9e46b34a2e559fbbfc1f95397c7b", - "translation_date": "2025-09-05T16:18:25+00:00", + "original_hash": "cb761595e5b6c42b99bb81bd13683311", + "translation_date": "2026-04-20T20:33:29+00:00", "source_file": "4-Classification/2-Classifiers-1/README.md", "language_code": "sk" }, @@ -552,8 +552,8 @@ "language_code": "sk" }, "README.md": { - "original_hash": "7fb48097f57e680b380cd9aae988d317", - "translation_date": "2026-04-06T17:18:33+00:00", + "original_hash": "3e3a6c7e68e0afe7e2276ac046e4d7a0", + "translation_date": "2026-04-20T20:31:14+00:00", "source_file": "README.md", "language_code": "sk" }, diff --git a/translations/sk/2-Regression/3-Linear/README.md b/translations/sk/2-Regression/3-Linear/README.md index 0ce537c1b..876d5bc6e 100644 --- a/translations/sk/2-Regression/3-Linear/README.md +++ b/translations/sk/2-Regression/3-Linear/README.md @@ -1,97 +1,97 @@ -# Vytvorte regresný model pomocou Scikit-learn: štyri spôsoby regresie +# Vytvorte regresný model pomocou Scikit-learn: regresia štyrmi spôsobmi ## Poznámka pre začiatočníkov Lineárna regresia sa používa, keď chceme predpovedať **číselnú hodnotu** (napríklad cenu domu, teplotu alebo predaj). -Funguje tak, že nájde priamku, ktorá najlepšie reprezentuje vzťah medzi vstupnými premennými a výstupom. +Funguje tak, že nájde priamku, ktorá najlepšie reprezentuje vzťah medzi vstupnými vlastnosťami a výstupom. -V tejto lekcii sa zameriavame na pochopenie konceptu predtým, než preskúmame pokročilejšie regresné techniky. -![Lineárna vs polynomiálna regresia infografika](../../../../translated_images/sk/linear-polynomial.5523c7cb6576ccab.webp) +V tejto lekcii sa zameriame na pochopenie konceptu predtým, než preskúmame pokročilejšie regresné techniky. +![Lineárna verzus polynomiálna regresia infografika](../../../../translated_images/sk/linear-polynomial.5523c7cb6576ccab.webp) > Infografika od [Dasani Madipalli](https://twitter.com/dasani_decoded) ## [Kvíz pred prednáškou](https://ff-quizzes.netlify.app/en/ml/) > ### [Táto lekcia je dostupná aj v R!](../../../../2-Regression/3-Linear/solution/R/lesson_3.html) -### Úvod +### Úvod -Doteraz ste preskúmali, čo je regresia, pomocou vzorových údajov zo súboru údajov o cene tekvíc, ktorý budeme používať počas celej tejto lekcie. Tiež ste ich vizualizovali pomocou Matplotlib. +Doteraz ste preskúmali, čo je regresia, na vzorových dátach získaných z datasetu s cenami tekvíc, ktoré budeme používať počas celej tejto lekcie. Tiež ste ich vizualizovali pomocou Matplotlib. -Teraz ste pripravení ponoriť sa hlbšie do regresie pre ML. Zatiaľ čo vizualizácia umožňuje lepšie pochopiť údaje, skutočná sila strojového učenia pochádza z _trénovania modelov_. Modely sa trénujú na historických dátach, aby automaticky zachytili závislosti v dátach, a umožňujú vám predpovedať výsledky pre nové dáta, ktoré model predtým nevidel. +Teraz ste pripravení ponoriť sa hlbšie do regresie v strojovom učení. Kým vizualizácia umožňuje lepšie pochopiť dáta, skutočná sila strojového učenia spočíva v _trénovaní modelov_. Modely sa trénujú na historických dátach, aby automaticky zachytili závislosti v dátach, a umožňujú predpovedať výsledky pre nové dáta, ktoré model predtým nevidel. -V tejto lekcii sa dozviete viac o dvoch typoch regresie: _základnej lineárnej regresii_ a _polynomiálnej regresii_ spolu s niektorou z matematiky, ktorá stojí za týmito technikami. Tieto modely nám umožnia predpovedať ceny tekvíc v závislosti od rôznych vstupných údajov. +V tejto lekcii sa naučíte viac o dvoch typoch regresie: _základná lineárna regresia_ a _polynomiálna regresia_, spolu s niektorou matematikou, ktorá stojí za týmito technikami. Tieto modely nám umožnia predpovedať ceny tekvíc v závislosti od rôznych vstupných dát. [![ML pre začiatočníkov - Pochopenie lineárnej regresie](https://img.youtube.com/vi/CRxFT8oTDMg/0.jpg)](https://youtu.be/CRxFT8oTDMg "ML pre začiatočníkov - Pochopenie lineárnej regresie") -> 🎥 Kliknite na obrázok vyššie pre krátke video o lineárnej regresii. +> 🎥 Kliknite na obrázok vyššie pre krátky video prehľad lineárnej regresie. -> Počas celého kurikula predpokladáme minimálne znalosti matematiky a snažíme sa ich sprístupniť študentom z iných odborov, tak sledujte poznámky, 🧮 upozornenia, diagramy a ďalšie výučbové pomôcky na lepšie pochopenie. +> V celom tomto kurze predpokladáme minimálne matematické znalosti a snažíme sa sprístupniť učenie študentom z iných odborov, preto sledujte poznámky, 🧮 odkazy, diagramy a iné nástroje na uľahčenie pochopenia. ### Predpoklady -Teraz by ste už mali byť oboznámení so štruktúrou údajov o tekviciach, ktoré skúmame. Nájdete ich prednačítané a predvyčistené v súbore _notebook.ipynb_ tejto lekcie. V súbore je cena tekvíc uvedená za košík v novom dátovom rámci. Uistite sa, že viete spustiť tieto notebooky v kerneloch vo Visual Studio Code. +Teraz by ste mali byť oboznámení so štruktúrou dát o tekviciach, ktoré skúmame. Nájdete ich prednačítané a predčistené v súbore _notebook.ipynb_ tejto lekcie. V súbore je cena tekvíc zobrazená na jeden košík. Uistite sa, že viete spustiť tieto notebooky v kerneloch Visual Studio Code. ### Príprava -Ako pripomienku, načítavate tieto údaje, aby ste na nich mohli klásť otázky. +Pripomíname, že tieto dáta načítavate preto, aby ste im mohli klásť otázky. -- Kedy je najlepší čas na nákup tekvíc? -- Akú cenu môžem očakávať za balenie mini tekvíc? -- Mám ich kúpiť v polkošíkoch alebo v krabici 1 1/9 košíka? -Poďme sa ďalej ponoriť do tohto dátového súboru. +- Kedy je najlepší čas kúpiť tekvice? +- Akú cenu môžem očakávať za balík minitekvíc? +- Mali by ste ich kupovať v polovičných košíkoch alebo v 1 1/9 košíkových krabiciach? +Poďme sa ďalej ponoriť do týchto dát. -V predchádzajúcej lekcii ste vytvorili dátový rámec Pandas a naplnili ho časťou pôvodného datasetu, štandardizujúc ceny podľa košíka. Týmto ste však získali iba asi 400 dátových bodov a len pre jesenné mesiace. +V predchádzajúcej lekcii ste vytvorili Pandas dátový rámec a naplnili ho časťou pôvodného datasetu, štandardizujúc ceny podľa košíka. Týmto spôsobom ste však získali iba asi 400 dátových bodov a len za jesenné mesiace. -Pozrite si údaje, ktoré sme prednačítali v sprievodnom notebooku tejto lekcie. Údaje sú predpripravené a prvý rozptýlený graf ukazuje mesiac predaja. Možno pôjdeme ďalej a vyčistíme dáta podrobnejšie. +Pozrite sa na dáta, ktoré sme prednačítali v notebooku k tejto lekcii. Dáta sú načítané a zobrazený je počiatočný bodový graf podľa mesiaca. Možno získame viac detailov o povahe dát ich ďalším čistením. -## Lineárna regresná čiara +## Lineárna regresná priamka -Ako ste sa naučili v Lekcii 1, cieľom lineárnej regresie je nakresliť čiaru, ktorá: +Ako ste sa naučili v Lekcii 1, cieľom cvičenia lineárnej regresie je byť schopný vyrenderovať priamku, ktorá: -- **Ukazuje vzťah medzi premennými**. Ukáže vzťah medzi premennými -- **Predpovedá**. Umožní presne predpovedať, kde by nový dátový bod ležal vzhľadom na túto čiaru. +- **Ukáže vzťahy premenných**. Zobrazí vzťah medzi premennými. +- **Umožní predpovede**. Presne predpovedá, kde by sa nový dátový bod mohol nachádzať vzhľadom na túto priamku. -Typické na **regresii metódou najmenších štvorcov** je kreslenie takéhoto druhu čiary. Termín "najmenšie štvorce" označuje proces minimalizácie celkovej chyby v našom modeli. Pre každý dátový bod meriame vertikálnu vzdialenosť (nazývanú rezíduum) medzi skutočným bodom a regresnou čiarou. +Typickým prístupom **Metódy najmenších štvorcov** je nakresliť tento typ priamky. Termín „Najmenšie štvorce“ sa vzťahuje na proces minimalizácie celkovej chyby v našom modeli. Pre každý dátový bod meriame zvislú vzdialenosť (nazývanú reziduál) medzi skutočným bodom a našou regresnou priamkou. -Tieto vzdialenosti umocňujeme na druhú pre dva hlavné dôvody: +Tieto vzdialenosti umocňujeme na druhú z dvoch hlavných dôvodov: -1. **Veľkosť pred smerom:** Chceme, aby chyba -5 bola rovnocenná chybe +5. Umocnenie na druhú zmení všetky hodnoty na kladné. +1. **Veľkosť nad smerom:** Chceme, aby chyba -5 bola braná rovnako ako chyba +5. Umocnením na druhú sa všetky hodnoty stanú kladnými. -2. **Trestenie odľahlých hodnôt:** Umocnenie na druhú dáva väčšiu váhu väčším chybám, núti čiaru zostať bližšie k bodom, ktoré sú vzdialené. +2. **Postihovanie odľahlých hodnôt:** Umocnenie na druhú dáva väčšiu váhu väčším chybám, nútiac priamku zostať bližšie k bodom, ktoré sú ďaleko. -Tieto umocnené hodnoty potom sčítame. Naším cieľom je nájsť čiaru, kde výsledný súčet bude čo najmenší (najmenšia možná hodnota) — odtiaľ názov "najmenšie štvorce". +Potom tieto štvorcové hodnoty sčítame. Naším cieľom je nájsť konkrétnu priamku, kde je tento súčet najmenší (najnižšia možná hodnota) — odtiaľ pochádza názov „Najmenšie štvorce“. -> **🧮 Ukáž mi matematiku** +> **🧮 Ukáž mi matematiku** > -> Táto čiara, nazývaná _čiara najlepšieho prispôsobenia_, môže byť vyjadrená [rovnicou](https://en.wikipedia.org/wiki/Simple_linear_regression): +> Táto priamka, nazývaná _priamkou najlepšieho prispôsobenia_, môže byť vyjadrená [rovnicou](https://en.wikipedia.org/wiki/Simple_linear_regression): > > ``` > Y = a + bX > ``` > -> `X` je 'vysvetľujúca premenná'. `Y` je 'závislá premenná'. Sklon čiary je `b` a `a` je y-priesečník, ktorý predstavuje hodnotu `Y` pre `X = 0`. +> `X` je 'vysvetľujúca premenná'. `Y` je 'závislá premenná'. Sklon priamky je `b` a `a` je y-priesečník, teda hodnota `Y` keď `X = 0`. > >![vypočítajte sklon](../../../../translated_images/sk/slope.f3c9d5910ddbfcf9.webp) > -> Najprv vypočítajte sklon `b`. Infografika od [Jen Looper](https://twitter.com/jenlooper) +> Najskôr vypočítajte sklon `b`. Infografika od [Jen Looper](https://twitter.com/jenlooper) > -> Inými slovami a odkazujúc na pôvodnú otázku našich údajov o tekviciach: "predpovedať cenu tekvice za košík podľa mesiaca", `X` by predstavoval cenu a `Y` by označoval mesiac predaja. +> Inými slovami, ak sa vraciame k pôvodnej otázke nášho datasetu o tekviciach: „predpovedať cenu tekvice na košík podľa mesiaca“, `X` by odkazovalo na cenu a `Y` by predstavovalo mesiac predaja. > ->![dokončite rovnicu](../../../../translated_images/sk/calculation.a209813050a1ddb1.webp) +>![doplnte rovnicu](../../../../translated_images/sk/calculation.a209813050a1ddb1.webp) > > Vypočítajte hodnotu Y. Ak platíte okolo 4 dolárov, musí to byť apríl! Infografika od [Jen Looper](https://twitter.com/jenlooper) > -> Matematika, ktorá počíta čiaru, musí ukázať sklon čiary, ktorý závisí aj od priesečníka, teda kde sa `Y` nachádza, keď `X = 0`. +> Matematika, ktorá vypočíta priamku, musí ukázať sklon priamky, ktorý závisí aj od priesečníka, čiže kde sa nachádza `Y`, keď `X = 0`. > -> Metódu výpočtu týchto hodnôt môžete vidieť na webovej stránke [Math is Fun](https://www.mathsisfun.com/data/least-squares-regression.html). Navštívte tiež [tento Least-squares kalkulátor](https://www.mathsisfun.com/data/least-squares-calculator.html), aby ste videli, ako hodnoty čísel ovplyvňujú čiaru. +> Metódu výpočtu týchto hodnôt si môžete pozrieť na stránke [Math is Fun](https://www.mathsisfun.com/data/least-squares-regression.html). Navštívte tiež [tento kalkulátor najmenších štvorcov](https://www.mathsisfun.com/data/least-squares-calculator.html) a sledujte, ako hodnoty čísel ovplyvňujú priamku. ## Korelácia -Ešte jeden termín, ktorý je dobré pochopiť, je **Korelačný koeficient** medzi danými premennými X a Y. Pomocou rozptýleného grafu môžete rýchlo vizualizovať tento koeficient. Graf, kde sú body rozptýlené pozdĺž čistej čiary, má vysokú koreláciu, zatiaľ čo graf, kde sú body rozptýlené všade medzi X a Y, má nízku koreláciu. +Je potrebné pochopiť ešte jeden pojem — **korelačný koeficient** medzi danými premennými X a Y. Pomocou bodového grafu môžete tento koeficient rýchlo vizualizovať. Graf, kde sú body poukladané do peknej priamky, má vysokú koreláciu, no graf, kde sú body rozptýlené všade medzi X a Y, má nízku koreláciu. -Dobrý lineárny regresný model bude taký, ktorý má vysoký (bližšie k 1 než k 0) Korelačný koeficient použitím metódy najmenších štvorcov s regresnou čiarou. +Dobrý lineárny regresný model bude mať vysoký (bližší k 1 než k 0) korelačný koeficient pomocou metódy najmenších štvorcov s regresnou priamkou. -✅ Spustite notebook sprevádzajúci túto lekciu a pozrite sa na rozptýlený graf Mesiac k Cene. Zdá sa vám, že dáta spájajúce Mesiac s Cenou predaja tekvíc majú vysokú alebo nízku koreláciu podľa vašej vizuálnej interpretácie rozptýleného grafu? Zmení sa to, ak namiesto `Month` použijete detailnejšie meranie, napríklad *deň v roku* (t.j. počet dní od začiatku roka)? +✅ Spustite notebook priložený k tejto lekcii a pozrite si bodový graf Mesiac voči cene. Má dátový vzťah medzi Mesiacom a cenou pri predaji tekvíc vysokú alebo nízku koreláciu podľa vašej vizuálnej interpretácie grafu? Zmení sa to, ak namiesto `Mesiaca` použijete jemnejšie meradlo, napríklad *deň v roku* (t.j. počet dní od začiatku roka)? -Nižšie v kóde predpokladáme, že sme údaje vyčistili a získali dátový rámec nazvaný `new_pumpkins`, podobný nasledovnému: +V nižšie uvedenom kóde predpokladáme, že sme dáta očistili a získali dátový rámec s názvom `new_pumpkins`, podobný nasledujúcemu: ID | Month | DayOfYear | Variety | City | Package | Low Price | High Price | Price ---|-------|-----------|---------|------|---------|-----------|------------|------- @@ -101,36 +101,36 @@ ID | Month | DayOfYear | Variety | City | Package | Low Price | High Price | Pri 73 | 10 | 274 | PIE TYPE | BALTIMORE | 1 1/9 bushel cartons | 17.0 | 17.0 | 15.454545 74 | 10 | 281 | PIE TYPE | BALTIMORE | 1 1/9 bushel cartons | 15.0 | 15.0 | 13.636364 -> Kód na vyčistenie dát je dostupný v [`notebook.ipynb`](notebook.ipynb). Vykonali sme rovnaké čistiace kroky ako v predchádzajúcej lekcii a vypočítali stĺpec `DayOfYear` pomocou nasledujúceho výrazu: +> Kód na čistenie dát je dostupný v [`notebook.ipynb`](notebook.ipynb). Prešli sme rovnakými krokmi čistenia ako v predchádzajúcej lekcii a vypočítali sme stĺpec `DayOfYear` podľa nasledujúceho výrazu: ```python day_of_year = pd.to_datetime(pumpkins['Date']).apply(lambda dt: (dt-datetime(dt.year,1,1)).days) ``` -Keďže už rozumiete matematike za lineárnou regresiou, vytvorme regresný model, aby sme zistili, či vieme predpovedať, ktoré balenie tekvíc bude mať najlepšiu cenu. Niekto, kto kupuje tekvice na jesennú výzdobu, by možno chcel tieto informácie, aby mohol optimalizovať nákup balení tekvíc pre svoj patch. +Teraz, keď máte pochopenie matematiky za lineárnou regresiou, vytvorme regresný model, aby sme zistili, či vieme predpovedať, ktorý balík tekvíc bude mať najlepšie ceny. Niekto, kto kupuje tekvice na jesennú výzdobu, môže potrebovať tieto informácie na optimalizáciu svojich nákupov. ## Hľadanie korelácie -[![ML pre začiatočníkov - Hľadanie korelácie: kľúč k lineárnej regresii](https://img.youtube.com/vi/uoRq-lW2eQo/0.jpg)](https://youtu.be/uoRq-lW2eQo "ML pre začiatočníkov - Hľadanie korelácie: kľúč k lineárnej regresii") +[![ML pre začiatočníkov - Hľadanie korelácie: Kľúč k lineárnej regresii](https://img.youtube.com/vi/uoRq-lW2eQo/0.jpg)](https://youtu.be/uoRq-lW2eQo "ML pre začiatočníkov - Hľadanie korelácie: Kľúč k lineárnej regresii") -> 🎥 Kliknite na obrázok vyššie pre krátke video o korelácii. +> 🎥 Kliknite na obrázok vyššie pre krátky video prehľad korelácie. -Z predchádzajúcej lekcie ste pravdepodobne videli, že priemerná cena podľa mesiacov vyzerá takto: +Z predchádzajúcej lekcie ste pravdepodobne videli, že priemerná cena za jednotlivé mesiace vyzerá takto: Priemerná cena podľa mesiaca -To naznačuje, že nejaká korelácia tam bude, a môžeme skúsiť natrénovať lineárny regresný model na predpovedanie vzťahu medzi `Month` a `Price`, alebo medzi `DayOfYear` a `Price`. Tu je rozptýlený graf, ktorý ukazuje druhý vzťah: +To naznačuje, že by mala existovať určitá korelácia, a môžeme skúsiť natrénovať lineárny regresný model na predpovedanie vzťahu medzi `Month` a `Price`, alebo medzi `DayOfYear` a `Price`. Tu je bodový graf znázorňujúci druhý vzťah: -Rozptýlený graf Cena vs. Deň v roku +Bodový graf Cena vs. Deň v roku -Skúsme zistiť koreláciu pomocou funkcie `corr`: +Pozrime sa, či existuje korelácia pomocou funkcie `corr`: ```python print(new_pumpkins['Month'].corr(new_pumpkins['Price'])) print(new_pumpkins['DayOfYear'].corr(new_pumpkins['Price'])) ``` -Zdá sa, že korelácia je pomerne malá, -0.15 podľa `Month` a -0.17 podľa `DayOfMonth`, ale môže tu byť iný dôležitý vzťah. Vyzerá to, že existujú rôzne skupiny cien zodpovedajúce rôznym odrodám tekvíc. Aby sme túto hypotézu potvrdili, nakreslime každú kategóriu tekvíc inou farbou. Pre odovzdanie parametra `ax` funkcii `scatter` môžeme vykresliť všetky body do rovnakého grafu: +Zdá sa, že korelácia je dosť malá, -0.15 podľa `Month` a -0.17 podľa `DayOfYear`, ale môže tam byť iný dôležitý vzťah. Vyzerá to, že existujú rôzne skupiny cien zodpovedajúce rôznym odrodám tekvíc. Aby sme túto hypotézu potvrdili, zobrazme každú kategóriu tekvíc inou farbou. Odovzdaním parametra `ax` funkcii `scatter` môžeme nakresliť všetky body na rovnakom grafe: ```python ax=None @@ -140,42 +140,42 @@ for i,var in enumerate(new_pumpkins['Variety'].unique()): ax = df.plot.scatter('DayOfYear','Price',ax=ax,c=colors[i],label=var) ``` -Rozptýlený graf Cena vs. Deň v roku s farebným rozlíšením +Bodový graf Cena vs. Deň v roku so zvýraznením farby -Naše vyšetrovanie naznačuje, že odroda má väčší vplyv na celkovú cenu než samotný dátum predaja. Vidíme to aj na stĺpcovom grafe: +Naše vyšetrovanie naznačuje, že odroda má väčší vplyv na celkovú cenu než skutočný dátum predaja. Vidieť to môžeme aj na stĺpcovom grafe: ```python new_pumpkins.groupby('Variety')['Price'].mean().plot(kind='bar') ``` -Stĺpcový graf ceny podľa odrody +Stĺpcový graf cena vs odroda -Zamerajme sa teraz na jednu odrodu tekvíc, 'pie type', a pozrime sa, aký vplyv má dátum na cenu: +Zamerajme sa teraz len na jednu odrodu tekvíc, 'pie type', a pozrime sa, aký vplyv má dátum na cenu: ```python pie_pumpkins = new_pumpkins[new_pumpkins['Variety']=='PIE TYPE'] pie_pumpkins.plot.scatter('DayOfYear','Price') ``` -Rozptýlený graf Cena vs. Deň v roku pre pie type +Bodový graf Cena vs. Deň v roku pre odrodu Pie Type -Ak teraz vypočítame koreláciu medzi `Price` a `DayOfYear` pomocou funkcie `corr`, získame približne `-0.27` — čo znamená, že natrénovanie prediktívneho modelu má zmysel. +Ak teraz vypočítame koreláciu medzi `Price` a `DayOfYear` pomocou funkcie `corr`, dostaneme niečo okolo `-0.27` — čo znamená, že trénovanie predikčného modelu dáva zmysel. -> Pred trénovaním lineárneho regresného modelu je dôležité zabezpečiť, že naše dáta sú čisté. Lineárna regresia nefunguje dobre s chýbajúcimi hodnotami, preto je rozumné zbaviť sa všetkých prázdnych buniek: +> Pred trénovaním lineárneho regresného modelu je dôležité uistiť sa, že naše dáta sú čisté. Lineárna regresia nefunguje dobre s chýbajúcimi hodnotami, preto je rozumné odstrániť všetky prázdne bunky: ```python pie_pumpkins.dropna(inplace=True) pie_pumpkins.info() ``` -Iný prístup by bol vyplniť tieto prázdne hodnoty priemernými hodnotami príslušného stĺpca. +Iný prístup je vyplniť prázdne hodnoty priemernými hodnotami zo zodpovedajúceho stĺpca. ## Jednoduchá lineárna regresia [![ML pre začiatočníkov - Lineárna a polynomiálna regresia pomocou Scikit-learn](https://img.youtube.com/vi/e4c_UP2fSjg/0.jpg)](https://youtu.be/e4c_UP2fSjg "ML pre začiatočníkov - Lineárna a polynomiálna regresia pomocou Scikit-learn") -> 🎥 Kliknite na obrázok vyššie pre krátke video o lineárnej a polynomiálnej regresii. +> 🎥 Kliknite na obrázok vyššie pre krátky video prehľad lineárnej a polynomiálnej regresie. -Na trénovanie nášho lineárneho regresného modelu použijeme knižnicu **Scikit-learn**. +Na natrénovanie nášho lineárneho regresného modelu použijeme knižnicu **Scikit-learn**. ```python from sklearn.linear_model import LinearRegression @@ -183,69 +183,69 @@ from sklearn.metrics import mean_squared_error from sklearn.model_selection import train_test_split ``` -Začneme tým, že oddelíme vstupné hodnoty (vlastnosti) a očakávaný výstup (štítok) do samostatných numpy polí: +Začneme oddelením vstupných hodnôt (vlastností) a očakávaného výstupu (štítku) do samostatných numpy polí: ```python X = pie_pumpkins['DayOfYear'].to_numpy().reshape(-1,1) y = pie_pumpkins['Price'] ``` -> Všimnite si, že sme museli vykonať `reshape` na vstupných dátach, aby ich balíček Linear Regression správne pochopil. Lineárna regresia očakáva vstup v tvare 2D poľa, kde každý riadok poľa zodpovedá vektoru vstupných vlastností. V našom prípade, keďže máme iba jeden vstup, potrebujeme pole tvaru N×1, kde N je veľkosť datasetu. +> Všimnite si, že sme museli vykonať `reshape` na vstupných dátach, aby ich lineárna regresia správne rozpoznala. Lineárna regresia očakáva 2D pole ako vstup, kde každý riadok poľa zodpovedá vektoru vstupných vlastností. V našom prípade, keďže máme len jeden vstup, potrebujeme pole tvaru N×1, kde N je veľkosť datasetu. -Potom musíme rozdeliť údaje na tréningové a testovacie datasety, aby sme mohli po trénovaní modelu overiť jeho výkon: +Potom musíme rozdeliť dáta na trénovaciu a testovaciu množinu, aby sme mohli model po trénovaní overiť: ```python X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) ``` -Nakoniec samotné trénovanie lineárneho regresného modelu zaberie len dva riadky kódu. Definujeme objekt `LinearRegression` a prispôsobíme ho našim dátam pomocou metódy `fit`: +Nakoniec samotné trénovanie lineárneho regresného modelu trvá len dve riadky kódu. Definujeme objekt `LinearRegression` a fitting vykonáme pomocou metódy `fit`: ```python lin_reg = LinearRegression() lin_reg.fit(X_train,y_train) ``` -Objekt `LinearRegression` po natrénovaní obsahuje všetky koeficienty regresie, ku ktorým sa dá pristúpiť pomocou vlastnosti `.coef_`. V našom prípade je len jeden koeficient, ktorý by mal byť okolo `-0.017`. To znamená, že ceny sa zdajú s časom mierne znižovať, ale nie príliš, približne o 2 centy za deň. Môžeme tiež pristúpiť k priesečníku regresie s osou Y pomocou `lin_reg.intercept_` – v našom prípade to bude okolo `21`, čo značí cenu na začiatku roka. +Objekt `LinearRegression` po príkaze `fit` obsahuje všetky koeficienty regresie, ku ktorým je možné pristúpiť pomocou vlastnosti `.coef_`. V našom prípade je tam len jeden koeficient, ktorý by mal byť okolo hodnoty `-0.017`. Znamená to, že ceny sa zdajú s časom mierne znižovať, ale nie príliš, približne o 2 centy za deň. Môžeme tiež pristúpiť k priesečníku regresie s osou Y pomocou `lin_reg.intercept_` - v našom prípade to bude okolo `21`, čo označuje cenu na začiatku roka. -Aby sme videli, aká je presnosť nášho modelu, môžeme predikovať ceny na testovacej množine dát a potom zmerať, ako sú naše predpovede blízke očakávaným hodnotám. To sa dá urobiť pomocou metriky strednej štvorcovej chyby (MSE), čo je priemer všetkých štvorcových rozdielov medzi očakávanou a predikovanou hodnotou. +Aby sme videli, aká je presnosť nášho modelu, môžeme predikovať ceny na testovacej sade dát a potom zmerať, ako blízko sú naše predikcie očakávaným hodnotám. To je možné urobiť pomocou metriky root mean square error (RMSE), čo je odmocnina z priemeru všetkých štvorcových rozdielov medzi očakávanými a predikovanými hodnotami. ```python pred = lin_reg.predict(X_test) -mse = np.sqrt(mean_squared_error(y_test,pred)) -print(f'Mean error: {mse:3.3} ({mse/np.mean(pred)*100:3.3}%)') +rmse = np.sqrt(mean_squared_error(y_test,pred)) +print(f'RMSE: {rmse:3.3} ({rmse/np.mean(pred)*100:3.3}%)') ``` -Naša chyba sa javí okolo 2 bodov, čo je približne 17%. Nie je to príliš dobré. Ďalším ukazovateľom kvality modelu je **koeficient determinácie**, ktorý môžeme získať takto: +Naša chyba sa zdá byť okolo 2 bodov, čo je približne 17%. Nie príliš dobre. Ďalším ukazovateľom kvality modelu je **koeficient determinácie**, ktorý je možné získať takto: ```python score = lin_reg.score(X_train,y_train) print('Model determination: ', score) ``` -Ak je hodnota 0, znamená to, že model neberie do úvahy vstupné dáta a správa sa ako *najhorší lineárny prediktor*, ktorý je jednoducho priemernou hodnotou výsledku. Hodnota 1 znamená, že dokážeme dokonale predpovedať všetky očakávané výstupy. V našom prípade je koeficient okolo 0.06, čo je dosť nízke. +Ak je hodnota 0, znamená to, že model nezohľadňuje vstupné dáta a správa sa ako *najhorší lineárny prediktor*, čo je jednoducho priemerná hodnota výsledku. Hodnota 1 znamená, že dokážeme dokonale predpovedať všetky očakávané výstupy. V našom prípade je koeficient okolo 0,06, čo je pomerne nízke. -Môžeme tiež vykresliť testovacie dáta spolu s regresnou čiarou, aby sme lepšie videli, ako regresia funguje v našom prípade: +Môžeme tiež zobraziť testovacie dáta spolu s regresnou čiarou, aby sme lepšie videli, ako regresia funguje v našom prípade: ```python plt.scatter(X_test,y_test) plt.plot(X_test,pred) ``` -Linear regression +Lineárna regresia ## Polynomická regresia -Ďalším typom lineárnej regresie je polynomická regresia. Kým niekedy existuje lineárny vzťah medzi premennými – čím väčšia je tekvica objemom, tým vyššia je cena – niekedy sa tieto vzťahy nedajú zobraziť ako rovina alebo priamka. +Ďalším typom lineárnej regresie je polynomická regresia. Zatiaľ čo niekedy existuje lineárny vzťah medzi premennými - čím väčšia tekvica objemom, tým vyššia cena - niekedy tieto vzťahy nemožno zobraziť ako rovinu alebo priamku. -✅ Tu je [niekoľko ďalších príkladov](https://online.stat.psu.edu/stat501/lesson/9/9.8) dát, pre ktoré by bolo vhodné použiť polynomickú regresiu +✅ Tu sú [niektoré ďalšie príklady](https://online.stat.psu.edu/stat501/lesson/9/9.8) dát, ktoré by mohli využiť polynomickú regresiu -Pozrite sa ešte raz na vzťah medzi dátumom a cenou. Zdá sa vám, že by mal byť nevyhnutne analyzovaný priamkou? Nemôžu ceny kolísať? V tomto prípade môžete skúsiť polynomickú regresiu. +Pozrite sa opäť na vzťah medzi Dátumom a Cenou. Zdá sa, že by tento rozptylový graf mal byť nevyhnutne analyzovaný priamkou? Nemôžu ceny kolísať? V takom prípade môžete skúsiť polynomickú regresiu. -✅ Polynomické výrazy sú matematické výrazy, ktoré môžu obsahovať jednu alebo viac premenných a koeficientov +✅ Polynómy sú matematické výrazy, ktoré môžu pozostávať z jednej alebo viacerých premenných a koeficientov -Polynomická regresia vytvára zakrivenú čiaru, aby lepšie vyhovela nelineárnym dátam. V našom prípade, ak do vstupných dát zahrnieme druhú mocninu premennej `DayOfYear`, mali by sme byť schopní prispôsobiť dáta parabolickou krivkou, ktorá bude mať minimum v určitom bode v priebehu roka. +Polynomická regresia vytvára zakrivenú čiaru, aby sa lepšie prispôsobila nelineárnym dátam. V našom prípade, ak zahrnieme do vstupných dát štvorcovú premennú `DayOfYear`, mali by sme byť schopní prispôsobiť naše dáta parabolickou krivkou, ktorá bude mať minimum v určitom bode počas roka. -Scikit-learn obsahuje užitočné [pipeline API](https://scikit-learn.org/stable/modules/generated/sklearn.pipeline.make_pipeline.html?highlight=pipeline#sklearn.pipeline.make_pipeline) na kombinovanie rôznych krokov spracovania dát dokopy. **Pipeline** je reťazec **estimatorov**. V našom prípade vytvoríme pipeline, ktorá najprv pridá polynomické prvky do nášho modelu a potom trénuje regresiu: +Scikit-learn obsahuje užitočné [API pipeline](https://scikit-learn.org/stable/modules/generated/sklearn.pipeline.make_pipeline.html?highlight=pipeline#sklearn.pipeline.make_pipeline) na spojenie rôznych krokov spracovania dát. **Pipeline** je reťazec **estimatorov**. V našom prípade vytvoríme pipeline, ktorá najprv pridá polynomické príznaky do nášho modelu a potom vytrénuje regresiu: ```python from sklearn.preprocessing import PolynomialFeatures @@ -256,36 +256,36 @@ pipeline = make_pipeline(PolynomialFeatures(2), LinearRegression()) pipeline.fit(X_train,y_train) ``` -Použitie `PolynomialFeatures(2)` znamená, že zahrnieme všetky polynómy druhého stupňa z vstupných dát. V našom prípade to bude iba `DayOfYear`2, ale pri dvoch vstupných premenných X a Y sa pridajú X2, XY a Y2. Môžeme tiež použiť polynómy vyšších stupňov, ak chceme. +Použitie `PolynomialFeatures(2)` znamená, že zahrnieme všetky polynómy druhého stupňa z vstupných dát. V našom prípade to bude iba `DayOfYear`2, ale ak máme dve vstupné premenné X a Y, pridajú sa X2, XY a Y2. Môžeme tiež použiť polynómy vyššieho stupňa, ak chceme. -Pipeline možno používať rovnako ako pôvodný objekt `LinearRegression`, teda môžeme pipeline natrénovať pomocou `fit` a potom použiť `predict` na získanie výsledkov predikcie. Tu je graf zobrazujúci testovacie dáta a aproximačnú krivku: +Pipeline môžeme používať rovnako ako pôvodný objekt `LinearRegression`, t.j. môžeme `fit` pipeline a potom použiť `predict` na získanie výsledkov predpovede. Tu je graf zobrazujúci testovacie dáta a aproximačnú krivku: -Polynomial regression +Polynomická regresia -Použitím polynomickej regresie môžeme dosiahnuť mierne nižšiu MSE a vyšší koeficient determinácie, ale nie výrazne. Musíme zohľadniť ďalšie vlastnosti! +Pomocou polynomickej regresie môžeme dosiahnuť mierne nižšiu MSE a vyšší koeficient determinácie, ale nie výrazne. Musíme zohľadniť aj ďalšie vlastnosti! -> Vidíte, že minimálne ceny tekvíc sa prejavujú niekde okolo Halloweenu. Ako by ste to vysvetlili? +> Môžete vidieť, že minimálne ceny tekvíc sa vyskytujú niekde okolo Halloween. Ako by ste to vysvetlili? -🎃 Gratulujeme, práve ste vytvorili model, ktorý môže pomôcť predpovedať cenu tekvíc na koláče. Pravdepodobne môžete rovnaký postup zopakovať pre všetky druhy tekvíc, ale to by bolo zdĺhavé. Naučíme sa teraz, ako zohľadniť odrodu tekvice v našom modeli! +🎃 Gratulujeme, práve ste vytvorili model, ktorý môže pomôcť predpovedať cenu tekvíc na pečenie. Pravdepodobne môžete zopakovať rovnaký postup pre všetky druhy tekvíc, ale to by bolo zdĺhavé. Teraz sa naučíme, ako zohľadniť druh tekvice v našom modeli! -## Kategorické vlastnosti +## Kategóriové premenné -V ideálnom svete chceme byť schopní predpovedať ceny pre rôzne odrody tekvíc pomocou toho istého modelu. Avšak stĺpec `Variety` je trochu iný ako stĺpce ako `Month`, pretože obsahuje nečíselné hodnoty. Takéto stĺpce sa nazývajú **kategorické**. +V ideálnom svete chceme byť schopní predpovedať ceny rôznych druhov tekvíc pomocou toho istého modelu. Avšak stĺpec `Variety` je trochu iný ako stĺpce ako `Month`, pretože obsahuje nečíselné hodnoty. Takéto stĺpce sa nazývajú **kategóriové**. -[![ML pre začiatočníkov – predikcie kategórií pomocou lineárnej regresie](https://img.youtube.com/vi/DYGliioIAE0/0.jpg)](https://youtu.be/DYGliioIAE0 "ML pre začiatočníkov – predikcie kategórií pomocou lineárnej regresie") +[![ML pre začiatočníkov - Predikcie kategóriových premenných pomocou lineárnej regresie](https://img.youtube.com/vi/DYGliioIAE0/0.jpg)](https://youtu.be/DYGliioIAE0 "ML pre začiatočníkov - Predikcie kategóriových premenných pomocou lineárnej regresie") -> 🎥 Kliknite na obrázok vyššie pre krátky videopríklad použitia kategorických vlastností. +> 🎥 Kliknite na obrázok vyššie pre krátke video o použití kategóriových premenných. -Tu vidíte, ako priemerná cena závisí na odrode: +Tu vidíte, ako sa priemerná cena líši podľa druhu: -Average price by variety +Priemerná cena podľa druhu -Aby sme zohľadnili odrodu, musíme ju najskôr premeniť na číselnú formu, teda **zakódovať** ju. Existuje niekoľko spôsobov, ako to urobiť: +Aby sme zohľadnili druh, musíme ho najskôr previesť na číselnú formu, teda ho **zakódovať**. Existuje niekoľko spôsobov, ako to môžeme urobiť: -* Jednoduché **číselné kódovanie** vytvorí tabuľku rôznych odrôd a potom nahradí názov odrody indexom z tejto tabuľky. To nie je najlepšia voľba pre lineárnu regresiu, pretože lineárna regresia vezme skutočnú číslenú hodnotu indexu a vynásobí ju koeficientom, čím ju pridá k výsledku. V našom prípade je vzťah medzi číslom indexu a cenou zjavne nelineárny, aj keď zabezpečíme, že indexy budú usporiadané určitým spôsobom. -* **One-hot encoding** nahradí stĺpec `Variety` štyrmi rôznymi stĺpcami, po jednom pre každú odrodu. Každý stĺpec bude obsahovať `1`, ak príslušný riadok je danej odrody, a `0` inak. To znamená, že v lineárnej regresii budú štyri koeficienty, jeden pre každú odrodu tekvíc, zodpovedajúce „počiatočnej cene“ (alebo skôr „dodatočnej cene“) pre túto konkrétnu odrodu. +* Jednoduché **číselné kódovanie** vytvorí tabuľku rôznych druhov a potom nahradí názov druhu jeho indexom v tejto tabuľke. Toto nie je najlepšia myšlienka pre lineárnu regresiu, pretože lineárna regresia berie skutočnú číselnú hodnotu indexu a pripočítava ju k výsledku, násobenú nejakým koeficientom. V našom prípade je vzťah medzi číslom indexu a cenou jasne nelineárny, aj keď by sme triedili indexy nejakým špecifickým spôsobom. +* **One-hot encoding** nahradí stĺpec `Variety` štyrmi rôznymi stĺpcami, po jednom pre každú odrodu. Každý stĺpec bude obsahovať `1`, ak príslušný riadok je daného druhu, a `0` inak. To znamená, že budú štyri koeficienty v lineárnej regresii, po jednom pre každú odrodu tekvín, ktoré budú zodpovedné za "počátečnú cenu" (alebo skôr "prídavok k cene") pre tento konkrétny druh. -Nasledujúci kód ukazuje, ako môžeme one-hot kódovať odrodu: +Nižšie je ukážka, ako môžeme pomocou one-hot encoding označiť druh: ```python pd.get_dummies(new_pumpkins['Variety']) @@ -302,14 +302,14 @@ pd.get_dummies(new_pumpkins['Variety']) 1741 | 0 | 1 | 0 | 0 1742 | 0 | 1 | 0 | 0 -Na trénovanie lineárnej regresie so vstupom ako one-hot kódovaná odroda stačí správne inicializovať dáta `X` a `y`: +Na trénovanie lineárnej regresie používajúcej one-hot kódované druhy ako vstupné premenné je potrebné správne inicializovať dáta `X` a `y`: ```python X = pd.get_dummies(new_pumpkins['Variety']) y = new_pumpkins['Price'] ``` -Zvyšok kódu je rovnaký ako sme používali vyššie na trénovanie lineárnej regresie. Ak to vyskúšate, uvidíte, že stredná štvorcová chyba je približne rovnaká, ale získame oveľa vyšší koeficient determinácie (~77%). Pre ešte presnejšie predikcie môžeme zohľadniť ďalšie kategorické vlastnosti, ako aj číselné vlastnosti, napríklad `Month` alebo `DayOfYear`. Na získanie jedného veľkého poľa vlastností môžeme použiť `join`: +Zvyšok kódu je rovnaký ako sme použili vyššie pre trénovanie lineárnej regresie. Ak to vyskúšate, uvidíte, že stredná štvorcová chyba je asi rovnaká, ale koeficient determinácie bude oveľa vyšší (~77%). Na ešte presnejšie predikcie môžeme zohľadniť viac kategóriových premenných, ako aj numerické premenné, napríklad `Month` alebo `DayOfYear`. Na vytvorenie jednej veľkej množiny príznakov môžeme použiť `join`: ```python X = pd.get_dummies(new_pumpkins['Variety']) \ @@ -319,11 +319,11 @@ X = pd.get_dummies(new_pumpkins['Variety']) \ y = new_pumpkins['Price'] ``` -Tu tiež zohľadňujeme `City` a typ `Package`, čo nám dáva MSE 2.84 (10%) a determináciu 0.94! +Tu tiež zohľadňujeme `City` a typ balenia (`Package`), čo nám dáva MSE 2.84 (10%) a koeficient determinácie 0.94! -## Spojme to všetko dokopy +## Zhrnutie všetkého dokopy -Na vytvorenie najlepšieho modelu môžeme použiť kombinované (one-hot kódované kategorické + číselné) dáta z vyššie uvedeného príkladu spolu s polynomickou regresiou. Tu je kompletný kód pre vašu pohodlnosť: +Aby sme vytvorili najlepší model, môžeme použiť kombinované (one-hot kódované kategóriové + numerické) dáta z vyššie uvedeného príkladu spolu s polynomickou regresiou. Tu je kompletný kód pre vaše pohodlie: ```python # nastaviť tréningové dáta @@ -336,14 +336,14 @@ y = new_pumpkins['Price'] # vykonať rozdelenie na trénovaciu a testovaciu množinu X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) -# nastaviť a trénovať pipeline +# nastaviť a natrénovať pipeline pipeline = make_pipeline(PolynomialFeatures(2), LinearRegression()) pipeline.fit(X_train,y_train) # predpovedať výsledky pre testovacie dáta pred = pipeline.predict(X_test) -# vypočítať MSE a koeficient určenia +# vypočítať MSE a koeficient determinácie mse = np.sqrt(mean_squared_error(y_test,pred)) print(f'Mean error: {mse:3.3} ({mse/np.mean(pred)*100:3.3}%)') @@ -351,28 +351,28 @@ score = pipeline.score(X_train,y_train) print('Model determination: ', score) ``` -To by nám malo dať najlepší koeficient determinácie takmer 97% a MSE=2.23 (~8% chyba predikcie). +Toto by nám malo dať najlepší koeficient determinácie takmer 97% a MSE=2.23 (~8% chyba predikcie). | Model | MSE | Koeficient determinácie | |-------|-----|-------------------------| -| Lineárna regresia s `DayOfYear` | 2.77 (17,2%) | 0.07 | -| Polynomická regresia s `DayOfYear` | 2.73 (17,0%) | 0.08 | -| Lineárna regresia s `Variety` | 5.24 (19,7%) | 0.77 | -| Lineárna regresia so všetkými vlastnosťami | 2.84 (10,5%) | 0.94 | -| Polynomická regresia so všetkými vlastnosťami | 2.23 (8,25%) | 0.97 | +| `DayOfYear` lineárny | 2.77 (17.2%) | 0.07 | +| `DayOfYear` polynomický | 2.73 (17.0%) | 0.08 | +| `Variety` lineárny | 5.24 (19.7%) | 0.77 | +| Všetky príznaky lineárny | 2.84 (10.5%) | 0.94 | +| Všetky príznaky polynomický | 2.23 (8.25%) | 0.97 | -🏆 Výborne! V tejto lekcii ste vytvorili štyri regresné modely a zlepšili kvalitu modelu na 97%. V záverečnej sekcii o regresii sa naučíte o logistickej regresii na určenie kategórií. +🏆 Výborne! Vytvorili ste štyri regresné modely v jednej lekcii a zlepšili kvalitu modelu na 97%. V poslednej časti o regresii sa naučíte o logistickej regresii na určovanie kategórií. --- ## 🚀Výzva -Otestujte niekoľko rôznych premenných v tomto zápisníku a zistite, ako korelácia súvisí s presnosťou modelu. +Otestujte niekoľko rôznych premenných v tomto notebooku a zistite, ako korelácia súvisí s presnosťou modelu. ## [Kvíz po prednáške](https://ff-quizzes.netlify.app/en/ml/) -## Prehľad a samostatné štúdium +## Opakovanie a samostatné štúdium -V tejto lekcii sme sa naučili o lineárnej regresii. Existujú aj iné dôležité typy regresie. Prečítajte si o technikách Stepwise, Ridge, Lasso a Elasticnet. Dobrou študijnou pomôckou je [kurz Stanford Statistical Learning](https://online.stanford.edu/courses/sohs-ystatslearning-statistical-learning). +V tejto lekcii sme sa naučili o lineárnej regresii. Existujú aj iné dôležité typy regresie. Prečítajte si o metódach Stepwise, Ridge, Lasso a Elasticnet. Dobrou študijnou pomôckou na osvojenie je kurz [Stanford Statistical Learning](https://online.stanford.edu/courses/sohs-ystatslearning-statistical-learning) ## Zadanie @@ -381,6 +381,6 @@ V tejto lekcii sme sa naučili o lineárnej regresii. Existujú aj iné dôleži --- -**Upozornenie**: -Tento dokument bol preložený pomocou AI prekladateľskej služby [Co-op Translator](https://github.com/Azure/co-op-translator). Hoci sa snažíme o presnosť, uvedomte si, že automatické preklady môžu obsahovať chyby alebo nepresnosti. Originálny dokument v jeho pôvodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nenesieme zodpovednosť za akékoľvek nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu. +**Zrieknutie sa zodpovednosti**: +Tento dokument bol preložený pomocou AI prekladateľskej služby [Co-op Translator](https://github.com/Azure/co-op-translator). Aj keď sa snažíme o presnosť, vezmite prosím na vedomie, že automatizované preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho rodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nie sme zodpovední za akékoľvek nedorozumenia alebo nesprávne výklady vyplývajúce z použitia tohto prekladu. \ No newline at end of file diff --git a/translations/sk/4-Classification/2-Classifiers-1/README.md b/translations/sk/4-Classification/2-Classifiers-1/README.md index 5cbd6f4f4..cb690c81c 100644 --- a/translations/sk/4-Classification/2-Classifiers-1/README.md +++ b/translations/sk/4-Classification/2-Classifiers-1/README.md @@ -1,17 +1,17 @@ -# Klasifikátory kuchýň 1 +# Klasifikátory kuchyne 1 -V tejto lekcii použijete dataset, ktorý ste si uložili z predchádzajúcej lekcie, plný vyvážených a čistých údajov o kuchyniach. +V tejto lekcii použijete dataset, ktorý ste si uložili z predchádzajúcej lekcie, plný vyvážených, čistých údajov o kuchyniach. -Tento dataset použijete s rôznymi klasifikátormi na _predpovedanie národnej kuchyne na základe skupiny ingrediencií_. Pri tom sa dozviete viac o tom, ako môžu byť algoritmy využívané na klasifikačné úlohy. +Tento dataset použijete s rôznymi klasifikátormi na _predpoveď danej národnej kuchyne na základe skupiny ingrediencií_. Počas toho sa dozviete viac o niektorých spôsoboch, ako možno algoritmy využiť na klasifikačné úlohy. -## [Kvíz pred prednáškou](https://ff-quizzes.netlify.app/en/ml/) +## [Prednáškový kvíz](https://ff-quizzes.netlify.app/en/ml/) # Príprava -Za predpokladu, že ste dokončili [Lekciu 1](../1-Introduction/README.md), uistite sa, že súbor _cleaned_cuisines.csv_ existuje v koreňovom priečinku `/data` pre tieto štyri lekcie. +Ak ste dokončili [Lekciu 1](../1-Introduction/README.md), uistite sa, že súbor _cleaned_cuisines.csv_ existuje v koreňovej priečinok `/data` pre tieto štyri lekcie. -## Cvičenie - predpovedanie národnej kuchyne +## Cvičenie - predpovedať národnú kuchyňu -1. Pracujte v priečinku _notebook.ipynb_ tejto lekcie, importujte tento súbor spolu s knižnicou Pandas: +1. V priečinku _notebook.ipynb_ tejto lekcie importujte tento súbor spolu s knižnicou Pandas: ```python import pandas as pd @@ -21,13 +21,13 @@ Za predpokladu, že ste dokončili [Lekciu 1](../1-Introduction/README.md), uist Údaje vyzerajú takto: -| | Unnamed: 0 | kuchyňa | mandľa | angelika | aníz | anízové semeno | jablko | jablkový brandy | marhuľa | armagnac | ... | whiskey | biely chlieb | biele víno | celozrnná pšeničná múka | víno | drevo | yam | droždie | jogurt | cuketa | +| | Unnamed: 0 | cuisine | almond | angelica | anise | anise_seed | apple | apple_brandy | apricot | armagnac | ... | whiskey | white_bread | white_wine | whole_grain_wheat_flour | wine | wood | yam | yeast | yogurt | zucchini | | --- | ---------- | ------- | ------ | -------- | ----- | ---------- | ----- | ------------ | ------- | -------- | --- | ------- | ----------- | ---------- | ----------------------- | ---- | ---- | --- | ----- | ------ | -------- | -| 0 | 0 | indická | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 1 | 1 | indická | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 2 | 2 | indická | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 3 | 3 | indická | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | -| 4 | 4 | indická | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | +| 0 | 0 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | +| 1 | 1 | indian | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | +| 2 | 2 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | +| 3 | 3 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | +| 4 | 4 | indian | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 1. Teraz importujte niekoľko ďalších knižníc: @@ -40,7 +40,7 @@ Za predpokladu, že ste dokončili [Lekciu 1](../1-Introduction/README.md), uist import numpy as np ``` -1. Rozdeľte X a y súradnice do dvoch dataframeov na trénovanie. `cuisine` môže byť dataframe s označeniami: +1. Rozdeľte súradnice X a y do dvoch dataframeov na trénovanie. `cuisine` môže byť dataframe s návestiami: ```python cuisines_label_df = cuisines_df['cuisine'] @@ -58,7 +58,7 @@ Za predpokladu, že ste dokončili [Lekciu 1](../1-Introduction/README.md), uist Name: cuisine, dtype: object ``` -1. Odstráňte stĺpec `Unnamed: 0` a stĺpec `cuisine` pomocou `drop()`. Zvyšok údajov uložte ako trénovateľné vlastnosti: +1. Odstráňte stĺpec `Unnamed: 0` a stĺpec `cuisine` pomocou funkcie `drop()`. Zvyšok dát uložte ako trénovateľné vlastnosti: ```python cuisines_feature_df = cuisines_df.drop(['Unnamed: 0', 'cuisine'], axis=1) @@ -67,7 +67,7 @@ Za predpokladu, že ste dokončili [Lekciu 1](../1-Introduction/README.md), uist Vaše vlastnosti vyzerajú takto: -| | mandľa | angelika | aníz | anízové semeno | jablko | jablkový brandy | marhuľa | armagnac | artemisia | artičok | ... | whiskey | biely chlieb | biele víno | celozrnná pšeničná múka | víno | drevo | yam | droždie | jogurt | cuketa | +| | almond | angelica | anise | anise_seed | apple | apple_brandy | apricot | armagnac | artemisia | artichoke | ... | whiskey | white_bread | white_wine | whole_grain_wheat_flour | wine | wood | yam | yeast | yogurt | zucchini | | ---: | -----: | -------: | ----: | ---------: | ----: | -----------: | ------: | -------: | --------: | --------: | ---: | ------: | ----------: | ---------: | ----------------------: | ---: | ---: | ---: | ----: | -----: | -------: | | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | @@ -75,85 +75,85 @@ Za predpokladu, že ste dokončili [Lekciu 1](../1-Introduction/README.md), uist | 3 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | ... | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | -Teraz ste pripravení trénovať váš model! +Teraz ste pripravení trénovať svoj model! ## Výber klasifikátora -Keď sú vaše údaje čisté a pripravené na trénovanie, musíte sa rozhodnúť, ktorý algoritmus použiť na túto úlohu. +Keď už sú vaše dáta čisté a pripravené na trénovanie, musíte sa rozhodnúť, ktorý algoritmus použiť. -Scikit-learn zaraďuje klasifikáciu pod Supervised Learning, a v tejto kategórii nájdete mnoho spôsobov klasifikácie. [Rozmanitosť](https://scikit-learn.org/stable/supervised_learning.html) je na prvý pohľad dosť zarážajúca. Nasledujúce metódy zahŕňajú techniky klasifikácie: +Scikit-learn zaraďuje klasifikáciu do kategórie Supervised Learning a v tejto kategórii nájdete mnoho spôsobov klasifikácie. [Rozmanitosť](https://scikit-learn.org/stable/supervised_learning.html) je na prvý pohľad dosť ohromujúca. Nasledujúce metódy zahŕňajú klasifikačné techniky: - Lineárne modely - Support Vector Machines -- Stochastický gradientný zostup +- Stochastic Gradient Descent - Najbližší susedia - Gaussovské procesy - Rozhodovacie stromy -- Ensemble metódy (hlasovací klasifikátor) -- Multiclass a multioutput algoritmy (multiclass a multilabel klasifikácia, multiclass-multioutput klasifikácia) +- Metódy ansámblov (voting Classifier) +- Multitriedne a multivýstupové algoritmy (multitriedna a multilabel klasifikácia, multitriedna multivýstupová klasifikácia) -> Na klasifikáciu údajov môžete použiť aj [neurónové siete](https://scikit-learn.org/stable/modules/neural_networks_supervised.html#classification), ale to je mimo rozsah tejto lekcie. +> Môžete tiež použiť [neurónové siete na klasifikáciu dát](https://scikit-learn.org/stable/modules/neural_networks_supervised.html#classification), ale to presahuje rozsah tejto lekcie. -### Aký klasifikátor zvoliť? +### Ktorý klasifikátor zvoliť? -Takže, ktorý klasifikátor by ste si mali vybrať? Často je dobré vyskúšať niekoľko a hľadať dobrý výsledok. Scikit-learn ponúka [porovnanie vedľa seba](https://scikit-learn.org/stable/auto_examples/classification/plot_classifier_comparison.html) na vytvorenom datasete, kde porovnáva KNeighbors, SVC dvoma spôsobmi, GaussianProcessClassifier, DecisionTreeClassifier, RandomForestClassifier, MLPClassifier, AdaBoostClassifier, GaussianNB a QuadraticDiscriminationAnalysis, pričom výsledky vizualizuje: +Ktorý klasifikátor by ste si teda mali vybrať? Často je spôsob, že skúsite niekoľko a hľadáte dobrý výsledok. Scikit-learn ponúka [bezprostredné porovnanie](https://scikit-learn.org/stable/auto_examples/classification/plot_classifier_comparison.html) na vytvorenom datasete, ktoré porovnáva KNeighbors, SVC dvoma spôsobmi, GaussianProcessClassifier, DecisionTreeClassifier, RandomForestClassifier, MLPClassifier, AdaBoostClassifier, GaussianNB a QuadraticDiscrinationAnalysis a vizualizuje výsledky: -![porovnanie klasifikátorov](../../../../4-Classification/2-Classifiers-1/images/comparison.png) -> Grafy generované na dokumentácii Scikit-learn +![porovnanie klasifikátorov](../../../../translated_images/sk/comparison.edfab56193a85e7f.webp) +> Grafy vytvorené v dokumentácii Scikit-learn -> AutoML tento problém elegantne rieši tým, že vykonáva tieto porovnania v cloude, čo vám umožňuje vybrať najlepší algoritmus pre vaše údaje. Vyskúšajte to [tu](https://docs.microsoft.com/learn/modules/automate-model-selection-with-azure-automl/?WT.mc_id=academic-77952-leestott) +> AutoML túto úlohu elegantne rieši tým, že vykonáva tieto porovnania v cloude, čo vám umožní vybrať najlepší algoritmus pre vaše dáta. Vyskúšajte to [tu](https://docs.microsoft.com/learn/modules/automate-model-selection-with-azure-automl/?WT.mc_id=academic-77952-leestott) ### Lepší prístup -Lepší spôsob ako náhodne hádať je však nasledovať nápady z tejto stiahnuteľnej [ML Cheat Sheet](https://docs.microsoft.com/azure/machine-learning/algorithm-cheat-sheet?WT.mc_id=academic-77952-leestott). Tu zistíme, že pre náš multiclass problém máme niekoľko možností: +Lepší spôsob ako hádať naslepo, je postupovať podľa odporúčaní v tomto stiahnuteľnom [ML Cheat sheet](https://docs.microsoft.com/azure/machine-learning/algorithm-cheat-sheet?WT.mc_id=academic-77952-leestott). Tu objavujeme, že pri našom multitriednom probléme máme niekoľko možností: -![cheatsheet pre multiclass problémy](../../../../4-Classification/2-Classifiers-1/images/cheatsheet.png) -> Časť Microsoftovej Algorithm Cheat Sheet, ktorá podrobne opisuje možnosti multiclass klasifikácie +![cheatsheet pre multitriedne problémy](../../../../translated_images/sk/cheatsheet.07a475ea444d2223.webp) +> Časť Microsoft Algorithm Cheat Sheet, rozoberajúca možnosti multitriednej klasifikácie -✅ Stiahnite si tento cheat sheet, vytlačte ho a zaveste na stenu! +✅ Stiahnite si tento cheat sheet, vytlačte si ho a zavesíte na stenu! -### Úvahy +### Odôvodnenie -Pozrime sa, či dokážeme rozumne zhodnotiť rôzne prístupy vzhľadom na obmedzenia, ktoré máme: +Pozrime sa, či dokážeme rozumovo prejsť rôznymi prístupmi vzhľadom na dané obmedzenia: -- **Neurónové siete sú príliš náročné**. Vzhľadom na náš čistý, ale minimálny dataset a fakt, že trénovanie prebieha lokálne cez notebooky, sú neurónové siete príliš náročné na túto úlohu. -- **Žiadny dvojtriedny klasifikátor**. Nepoužívame dvojtriedny klasifikátor, takže to vylučuje one-vs-all. -- **Rozhodovací strom alebo logistická regresia by mohli fungovať**. Rozhodovací strom by mohol fungovať, alebo logistická regresia pre multiclass údaje. -- **Multiclass Boosted Decision Trees riešia iný problém**. Multiclass Boosted Decision Tree je najvhodnejší pre neparametrické úlohy, napr. úlohy určené na vytváranie rebríčkov, takže pre nás nie je užitočný. +- **Neurónové siete sú príliš náročné**. Vzhľadom na náš čistý, ale minimálny dataset a fakt, že trénovanie beží lokálne cez notebooky, sú neurónové siete príliš náročné na túto úlohu. +- **Žiadny klasifikátor pre dve triedy**. Nepoužívame klasifikátor pre dve triedy, takže možnosť "one-vs-all" vylučujeme. +- **Decision tree alebo logická regresia môže fungovať**. Môže fungovať rozhodovací strom alebo logistická regresia pre multitriedne dáta. +- **Multitriedne boosted rozhodovacie stromy riešia inú úlohu**. Multitriedny boosted rozhodovací strom je vhodnejší pre neparametrické úlohy, napríklad konštruovanie rebríčkov, takže pre nás nie je užitočný. -### Použitie Scikit-learn +### Použitie Scikit-learn -Budeme používať Scikit-learn na analýzu našich údajov. Existuje však mnoho spôsobov, ako použiť logistickú regresiu v Scikit-learn. Pozrite sa na [parametre na nastavenie](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html?highlight=logistic%20regressio#sklearn.linear_model.LogisticRegression). +Použijeme Scikit-learn na analýzu našich dát. Existuje však mnoho spôsobov, ako použiť logistickú regresiu v Scikit-learn. Pozrite si [parametre](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html?highlight=logistic%20regressio#sklearn.linear_model.LogisticRegression), ktoré je možné odovzdať. -V podstate existujú dva dôležité parametre - `multi_class` a `solver` - ktoré musíme špecifikovať, keď požiadame Scikit-learn o vykonanie logistickej regresie. Hodnota `multi_class` aplikuje určitú logiku. Hodnota solveru určuje, aký algoritmus sa použije. Nie všetky solvery môžu byť spárované so všetkými hodnotami `multi_class`. +Podstatné sú dva parametre - `multi_class` a `solver` - ktoré musíme určiť, keď žiadame Scikit-learn o vykonanie logistickej regresie. Hodnota `multi_class` aplikuje určitý spôsob správania. Hodnota solveru je algoritmus, ktorý sa použije. Nie všetky solvery sú kompatibilné so všetkými hodnotami `multi_class`. -Podľa dokumentácie, v prípade multiclass, tréningový algoritmus: +Podľa dokumentácie, pri multitriednom prípade, tréningový algoritmus: -- **Používa schému one-vs-rest (OvR)**, ak je možnosť `multi_class` nastavená na `ovr` -- **Používa cross-entropy loss**, ak je možnosť `multi_class` nastavená na `multinomial`. (Momentálne je možnosť `multinomial` podporovaná iba solvermi ‘lbfgs’, ‘sag’, ‘saga’ a ‘newton-cg’.) +- **Používa schému one-vs-rest (OvR),** ak je `multi_class` nastavený na `ovr` +- **Používa cross-entropy loss**, ak je `multi_class` nastavený na `multinomial`. (Momentálne je možnosť `multinomial` podporovaná iba solvermi ‘lbfgs’, ‘sag’, ‘saga’ a ‘newton-cg’)." -> 🎓 Schéma tu môže byť buď 'ovr' (one-vs-rest) alebo 'multinomial'. Keďže logistická regresia je skutočne navrhnutá na podporu binárnej klasifikácie, tieto schémy jej umožňujú lepšie zvládnuť úlohy multiclass klasifikácie. [zdroj](https://machinelearningmastery.com/one-vs-rest-and-one-vs-one-for-multi-class-classification/) +> 🎓 'schéma' tu môže byť 'ovr' (one-vs-rest) alebo 'multinomial'. Keďže logistická regresia je navrhnutá na binárnu klasifikáciu, tieto schémy jej umožňujú lepšie zvládnuť multitriedne klasifikačné úlohy. [zdroj](https://machinelearningmastery.com/one-vs-rest-and-one-vs-one-for-multi-class-classification/) -> 🎓 Solver je definovaný ako "algoritmus, ktorý sa použije na optimalizačný problém". [zdroj](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html?highlight=logistic%20regressio#sklearn.linear_model.LogisticRegression). +> 🎓 'solver' je definovaný ako "algoritmus, ktorý sa použije v optimalizačnej úlohe". [zdroj](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html?highlight=logistic%20regressio#sklearn.linear_model.LogisticRegression). -Scikit-learn ponúka túto tabuľku na vysvetlenie, ako solvery zvládajú rôzne výzvy, ktoré predstavujú rôzne typy dátových štruktúr: +Scikit-learn ponúka túto tabuľku, ktorá vysvetľuje, ako solvery spracovávajú rôzne výzvy, ktoré predstavujú rôzne štruktúry dát: -![solvery](../../../../4-Classification/2-Classifiers-1/images/solvers.png) +![solvery](../../../../translated_images/sk/solvers.5fc648618529e627.webp) -## Cvičenie - rozdelenie údajov +## Cvičenie - rozdeliť dáta -Môžeme sa zamerať na logistickú regresiu pre náš prvý tréningový pokus, keďže ste sa o nej nedávno učili v predchádzajúcej lekcii. -Rozdeľte svoje údaje na trénovacie a testovacie skupiny pomocou `train_test_split()`: +Môžeme sa zamerať na logistickú regresiu pre náš prvý pokus o trénovanie, keďže ste o nej nedávno čítali v predchádzajúcej lekcii. +Rozdeľte dáta na trénovacie a testovacie skupiny pomocou volania `train_test_split()`: ```python X_train, X_test, y_train, y_test = train_test_split(cuisines_feature_df, cuisines_label_df, test_size=0.3) ``` -## Cvičenie - aplikácia logistickej regresie +## Cvičenie - aplikovať logistickú regresiu -Keďže používate prípad multiclass, musíte si vybrať, akú _schému_ použiť a aký _solver_ nastaviť. Použite LogisticRegression s nastavením multiclass a solverom **liblinear** na trénovanie. +Keďže používate multitriedny prípad, musíte si vybrať, akú _schému_ použiť a aký _solver_ nastaviť. Použite LogisticRegression s multitriednym nastavením a **liblinear** solverom na trénovanie. -1. Vytvorte logistickú regresiu s multi_class nastavenou na `ovr` a solverom nastaveným na `liblinear`: +1. Vytvorte logistickú regresiu s `multi_class` nastaveným na `ovr` a solverom `liblinear`: ```python lr = LogisticRegression(multi_class='ovr',solver='liblinear') @@ -163,27 +163,28 @@ Keďže používate prípad multiclass, musíte si vybrať, akú _schému_ použ print ("Accuracy is {}".format(accuracy)) ``` - ✅ Vyskúšajte iný solver, napríklad `lbfgs`, ktorý je často nastavený ako predvolený. -> Poznámka: Použite funkciu Pandas [`ravel`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.ravel.html) na zjednodušenie vašich údajov, keď je to potrebné. -Presnosť je dobrá na viac ako **80%**! + ✅ Vyskúšajte iný solver ako `lbfgs`, ktorý je často nastavený ako predvolený -1. Tento model si môžete vyskúšať na jednom riadku dát (#50): + > Poznámka: Použite funkciu Pandas [`ravel`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.ravel.html) na zploštenie dát, keď je to potrebné. + + Presnosť je dobrá, vyše **80%**! + +1. Model si môžete vyskúšať tak, že otestujete jeden riadok dát (#50): ```python print(f'ingredients: {X_test.iloc[50][X_test.iloc[50]!=0].keys()}') print(f'cuisine: {y_test.iloc[50]}') ``` - Výsledok sa zobrazí: + Výsledok sa vytlačí: ```output ingredients: Index(['cilantro', 'onion', 'pea', 'potato', 'tomato', 'vegetable_oil'], dtype='object') cuisine: indian ``` - ✅ Skúste iné číslo riadku a skontrolujte výsledky. - -1. Ak chcete ísť hlbšie, môžete skontrolovať presnosť tejto predikcie: + ✅ Vyskúšajte iné číslo riadku a skontrolujte výsledky +1. Hlbšie preskúmajte a overte presnosť tohto predpovede: ```python test= X_test.iloc[50].values.reshape(-1, 1).T @@ -195,7 +196,7 @@ Presnosť je dobrá na viac ako **80%**! topPrediction.head() ``` - Výsledok sa zobrazí - indická kuchyňa je najpravdepodobnejší odhad s dobrou pravdepodobnosťou: + Výsledok je vytlačený – najpravdepodobnejšia je indická kuchyňa, s dobrou pravdepodobnosťou: | | 0 | | -------: | -------: | @@ -205,7 +206,7 @@ Presnosť je dobrá na viac ako **80%**! | korean | 0.017277 | | thai | 0.007634 | - ✅ Dokážete vysvetliť, prečo si model myslí, že ide o indickú kuchyňu? + ✅ Dokážete vysvetliť, prečo si model dosť iste myslí, že ide o indickú kuchyňu? 1. Získajte viac detailov vytlačením klasifikačnej správy, ako ste to robili v lekciách o regresii: @@ -214,31 +215,34 @@ Presnosť je dobrá na viac ako **80%**! print(classification_report(y_test,y_pred)) ``` - | | presnosť | recall | f1-skóre | podpora | - | ------------ | -------- | ------ | -------- | ------- | - | chinese | 0.73 | 0.71 | 0.72 | 229 | - | indian | 0.91 | 0.93 | 0.92 | 254 | - | japanese | 0.70 | 0.75 | 0.72 | 220 | - | korean | 0.86 | 0.76 | 0.81 | 242 | - | thai | 0.79 | 0.85 | 0.82 | 254 | - | presnosť | 0.80 | 1199 | | | - | priemer makro| 0.80 | 0.80 | 0.80 | 1199 | - | vážený priemer| 0.80 | 0.80 | 0.80 | 1199 | + | | precision | recall | f1-score | support | + | ------------ | --------- | ------ | -------- | ------- | + | chinese | 0.73 | 0.71 | 0.72 | 229 | + | indian | 0.91 | 0.93 | 0.92 | 254 | + | japanese | 0.70 | 0.75 | 0.72 | 220 | + | korean | 0.86 | 0.76 | 0.81 | 242 | + | thai | 0.79 | 0.85 | 0.82 | 254 | + | accuracy | | | 0.80 | 1199 | + | macro avg | 0.80 | 0.80 | 0.80 | 1199 | + | weighted avg | 0.80 | 0.80 | 0.80 | 1199 | ## 🚀Výzva -V tejto lekcii ste použili vyčistené dáta na vytvorenie modelu strojového učenia, ktorý dokáže predpovedať národnú kuchyňu na základe série ingrediencií. Venujte čas preskúmaniu mnohých možností, ktoré Scikit-learn ponúka na klasifikáciu dát. Ponorte sa hlbšie do konceptu 'solver', aby ste pochopili, čo sa deje v zákulisí. +V tejto lekcii ste použili vyčistené dáta na vybudovanie modelu strojového učenia, ktorý dokáže predpovedať národnú kuchyňu na základe série ingrediencií. Venujte čas preštudovaniu mnohých možností, ktoré Scikit-learn poskytuje na klasifikáciu dát. Hlbšie sa oboznámte s konceptom „solver“ a pochopte, čo sa deje v pozadí. ## [Kvíz po prednáške](https://ff-quizzes.netlify.app/en/ml/) -## Prehľad & Samoštúdium +## Prehľad a samostatné štúdium + +Málo sa ponorte do matematiky za logistickou regresiou v [tejto lekcii](https://people.eecs.berkeley.edu/~russell/classes/cs194/f11/lectures/CS194%20Fall%202011%20Lecture%2006.pdf) -Preskúmajte matematiku za logistickou regresiou v [tejto lekcii](https://people.eecs.berkeley.edu/~russell/classes/cs194/f11/lectures/CS194%20Fall%202011%20Lecture%2006.pdf) -## Zadanie +## Úloha -[Preskúmajte solvery](assignment.md) +[Študujte solver-y](assignment.md) --- -**Upozornenie**: -Tento dokument bol preložený pomocou služby AI prekladu [Co-op Translator](https://github.com/Azure/co-op-translator). Hoci sa snažíme o presnosť, prosím, berte na vedomie, že automatizované preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho rodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nie sme zodpovední za žiadne nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu. \ No newline at end of file + +**Zrieknutie sa zodpovednosti**: +Tento dokument bol preložený pomocou služby prekladov AI [Co-op Translator](https://github.com/Azure/co-op-translator). Hoci sa snažíme o presnosť, majte prosím na pamäti, že automatické preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho rodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nie sme zodpovední za akékoľvek nedorozumenia alebo nesprávne výklady vyplývajúce z použitia tohto prekladu. + \ No newline at end of file diff --git a/translations/sk/README.md b/translations/sk/README.md index ced2f1d64..bd53386fd 100644 --- a/translations/sk/README.md +++ b/translations/sk/README.md @@ -1,23 +1,23 @@ -[![GitHub licencia](https://img.shields.io/github/license/microsoft/ML-For-Beginners.svg)](https://github.com/microsoft/ML-For-Beginners/blob/master/LICENSE) -[![GitHub prispievatelia](https://img.shields.io/github/contributors/microsoft/ML-For-Beginners.svg)](https://GitHub.com/microsoft/ML-For-Beginners/graphs/contributors/) -[![GitHub problémy](https://img.shields.io/github/issues/microsoft/ML-For-Beginners.svg)](https://GitHub.com/microsoft/ML-For-Beginners/issues/) -[![GitHub žiadosti o zlúčenie](https://img.shields.io/github/issues-pr/microsoft/ML-For-Beginners.svg)](https://GitHub.com/microsoft/ML-For-Beginners/pulls/) +[![GitHub license](https://img.shields.io/github/license/microsoft/ML-For-Beginners.svg)](https://github.com/microsoft/ML-For-Beginners/blob/master/LICENSE) +[![GitHub contributors](https://img.shields.io/github/contributors/microsoft/ML-For-Beginners.svg)](https://GitHub.com/microsoft/ML-For-Beginners/graphs/contributors/) +[![GitHub issues](https://img.shields.io/github/issues/microsoft/ML-For-Beginners.svg)](https://GitHub.com/microsoft/ML-For-Beginners/issues/) +[![GitHub pull-requests](https://img.shields.io/github/issues-pr/microsoft/ML-For-Beginners.svg)](https://GitHub.com/microsoft/ML-For-Beginners/pulls/) [![PRs Welcome](https://img.shields.io/badge/PRs-welcome-brightgreen.svg?style=flat-square)](http://makeapullrequest.com) -[![GitHub pozorovatelia](https://img.shields.io/github/watchers/microsoft/ML-For-Beginners.svg?style=social&label=Watch)](https://GitHub.com/microsoft/ML-For-Beginners/watchers/) -[![GitHub forky](https://img.shields.io/github/forks/microsoft/ML-For-Beginners.svg?style=social&label=Fork)](https://GitHub.com/microsoft/ML-For-Beginners/network/) -[![GitHub hviezdy](https://img.shields.io/github/stars/microsoft/ML-For-Beginners.svg?style=social&label=Star)](https://GitHub.com/microsoft/ML-For-Beginners/stargazers/) +[![GitHub watchers](https://img.shields.io/github/watchers/microsoft/ML-For-Beginners.svg?style=social&label=Watch)](https://GitHub.com/microsoft/ML-For-Beginners/watchers/) +[![GitHub forks](https://img.shields.io/github/forks/microsoft/ML-For-Beginners.svg?style=social&label=Fork)](https://GitHub.com/microsoft/ML-For-Beginners/network/) +[![GitHub stars](https://img.shields.io/github/stars/microsoft/ML-For-Beginners.svg?style=social&label=Star)](https://GitHub.com/microsoft/ML-For-Beginners/stargazers/) ### 🌐 Podpora viacerých jazykov -#### Podporované cez GitHub Action (Automatizované a vždy aktuálne) +#### Podporované cez GitHub Action (automatizované a vždy aktuálne) -[Arabčina](../ar/README.md) | [Bengálčina](../bn/README.md) | [Bulharčina](../bg/README.md) | [Barmčina (Myanmar)](../my/README.md) | [Čínština (zjednodušená)](../zh-CN/README.md) | [Čínština (tradičná, Hong Kong)](../zh-HK/README.md) | [Čínština (tradičná, Macao)](../zh-MO/README.md) | [Čínština (tradičná, Taiwan)](../zh-TW/README.md) | [Chorvátčina](../hr/README.md) | [Čeština](../cs/README.md) | [Dánčina](../da/README.md) | [Holandčina](../nl/README.md) | [Estónčina](../et/README.md) | [Fínčina](../fi/README.md) | [Francúzština](../fr/README.md) | [Nemčina](../de/README.md) | [Gréčtina](../el/README.md) | [Hebrejčina](../he/README.md) | [Hindčina](../hi/README.md) | [Maďarčina](../hu/README.md) | [Indonézčina](../id/README.md) | [Taliančina](../it/README.md) | [Japončina](../ja/README.md) | [Kannadčina](../kn/README.md) | [Khmérčina](../km/README.md) | [Kórejčina](../ko/README.md) | [Litovčina](../lt/README.md) | [Malajčina](../ms/README.md) | [Malayalam](../ml/README.md) | [Maráthčina](../mr/README.md) | [Nepálčina](../ne/README.md) | [Nigérijský pidžin](../pcm/README.md) | [Nórčina](../no/README.md) | [Perzština (Farsi)](../fa/README.md) | [Poľština](../pl/README.md) | [Portugalčina (Brazília)](../pt-BR/README.md) | [Portugalčina (Portugalsko)](../pt-PT/README.md) | [Pandžábčina (Gurmukhí)](../pa/README.md) | [Rumunčina](../ro/README.md) | [Ruština](../ru/README.md) | [Srbčina (cyrilika)](../sr/README.md) | [Slovenčina](./README.md) | [Slovinčina](../sl/README.md) | [Španielčina](../es/README.md) | [Svahilčina](../sw/README.md) | [Švédčina](../sv/README.md) | [Tagalog (Filipínčina)](../tl/README.md) | [Tamilčina](../ta/README.md) | [Telugčina](../te/README.md) | [Thajčina](../th/README.md) | [Turečtina](../tr/README.md) | [Ukrajinčina](../uk/README.md) | [Urdu](../ur/README.md) | [Vietnamčina](../vi/README.md) +[Arabčina](../ar/README.md) | [Bengálčina](../bn/README.md) | [Bulharčina](../bg/README.md) | [Barmský (Myanmar)](../my/README.md) | [Čínština (zjednodušená)](../zh-CN/README.md) | [Čínština (tradičná, Hongkong)](../zh-HK/README.md) | [Čínština (tradičná, Macau)](../zh-MO/README.md) | [Čínština (tradičná, Taiwan)](../zh-TW/README.md) | [Chorvátčina](../hr/README.md) | [Čeština](../cs/README.md) | [Dánčina](../da/README.md) | [Holandčina](../nl/README.md) | [Estónčina](../et/README.md) | [Fínčina](../fi/README.md) | [Francúzština](../fr/README.md) | [Nemčina](../de/README.md) | [Gréčtina](../el/README.md) | [Hebrejčina](../he/README.md) | [Hindčina](../hi/README.md) | [Maďarčina](../hu/README.md) | [Indonézčina](../id/README.md) | [Taliančina](../it/README.md) | [Japončina](../ja/README.md) | [Kannadčina](../kn/README.md) | [Khmerčina](../km/README.md) | [Kórejčina](../ko/README.md) | [Litovčina](../lt/README.md) | [Malajčina](../ms/README.md) | [Malajálamčina](../ml/README.md) | [Maráthčina](../mr/README.md) | [Nepálčina](../ne/README.md) | [Nigérijský pidžin](../pcm/README.md) | [Nórčina](../no/README.md) | [Perzština (Farsi)](../fa/README.md) | [Poľština](../pl/README.md) | [Portugalčina (Brazília)](../pt-BR/README.md) | [Portugalčina (Portugalsko)](../pt-PT/README.md) | [Pandžábčina (Gurmukhi)](../pa/README.md) | [Rumunčina](../ro/README.md) | [Ruština](../ru/README.md) | [Srbčina (cyrilika)](../sr/README.md) | [Slovenčina](./README.md) | [Slovinčina](../sl/README.md) | [Španielčina](../es/README.md) | [Swahilčina](../sw/README.md) | [Švédčina](../sv/README.md) | [Tagalog (filipínska)](../tl/README.md) | [Tamilčina](../ta/README.md) | [Telugčina](../te/README.md) | [Thajčina](../th/README.md) | [Turečtina](../tr/README.md) | [Ukrajinčina](../uk/README.md) | [Urdu](../ur/README.md) | [Vietnamčina](../vi/README.md) -> **Radšej klonujete lokálne?** +> **Radšej klonovať lokálne?** > -> Tento repozitár obsahuje viac ako 50 jazykových prekladov, čo výrazne zvyšuje veľkosť sťahovania. Ak chcete klonovať bez prekladov, použite sparse checkout: +> Tento repozitár obsahuje viac ako 50 prekladov, čo výrazne zväčšuje veľkosť sťahovania. Ak chcete klonovať bez prekladov, použite sparse checkout: > > **Bash / macOS / Linux:** > ```bash @@ -33,64 +33,65 @@ > git sparse-checkout set --no-cone "/*" "!translations" "!translated_images" > ``` > -> Toto vám zabezpečí všetko potrebné na dokončenie kurzu s oveľa rýchlejším sťahovaním. +> Toto vám poskytne všetko potrebné na dokončenie kurzu s oveľa rýchlejším stiahnutím. -#### Pridajte sa k našej komunite +#### Pridajte sa do našej komunity [![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG) -Máme prebiehajúcu sériu Learn with AI na Discorde, dozviete sa viac a pripojte sa k nám na [Learn with AI Series](https://aka.ms/learnwithai/discord) od 18. do 30. septembra 2025. Získate tipy a triky na používanie GitHub Copilot pre Data Science. +Máme prebiehajúcu sériu Learn with AI na Discorde, dozviete sa viac a pripojte sa k nám na [Learn with AI Series](https://aka.ms/learnwithai/discord) od 18. do 30. septembra 2025. Dostanete tipy a triky ako používať GitHub Copilot pre Data Science. ![Séria Learn with AI](../../translated_images/sk/3.9b58fd8d6c373c20.webp) # Strojové učenie pre začiatočníkov - Učebný plán -> 🌍 Cestujte po svete a objavujte Strojové učenie cez svetové kultúry 🌍 +> 🌍 Cestujte po svete a objavujte strojové učenie prostredníctvom svetových kultúr 🌍 -Cloud Advocates v Microsoftu s radosťou ponúkajú 12-týždňový učebný plán s 26 lekciami o **Strojovom učení**. V tomto učebnom pláne sa naučíte, čo sa niekedy nazýva **klasické strojové učenie**, pričom primárne používame knižnicu Scikit-learn a vyhýbame sa hlbokému učeniu, ktoré je pokryté v našom [učebnom pláne AI pre začiatočníkov](https://aka.ms/ai4beginners). Tieto lekcie skombinujte aj s našim [učebným plánom Data Science pre začiatočníkov](https://aka.ms/ds4beginners)! +Cloud Advocates v Microsoft s potešením ponúkajú 12-týždňový, 26-lekčný učebný plán o **strojovom učení**. V tomto učebnom pláne sa naučíte o niečom, čo sa niekedy nazýva **klasické strojové učenie**, využívajúcom predovšetkým knižnicu Scikit-learn a vyhýbajúcom sa hlbokému učeniu, ktoré je zahrnuté v našom [učebnom pláne AI pre začiatočníkov](https://aka.ms/ai4beginners). Kombinujte tieto lekcie aj s naším [učebným plánom pre začiatočníkov v dátovej vede](https://aka.ms/ds4beginners)! -Cestujte s nami po svete a aplikujte tieto klasické techniky na dáta z rôznych oblastí sveta. Každá lekcia obsahuje kvízy pred a po lekcii, písomné inštrukcie na dokončenie lekcie, riešenie, zadanie a ďalšie. Naša projektovo orientovaná pedagogika vám umožňuje učiť sa priamo počas tvorby, čo je osvedčený spôsob, ako si nové vedomosti udržať. +Cestujte s nami po svete, keď aplikujeme tieto klasické techniky na dáta z mnohých oblastí sveta. Každá lekcia obsahuje kvízy pred a po lekcii, písomné inštrukcie na dokončenie lekcie, riešenie, úlohy a ďalšie. Naša projektovo orientovaná pedagogika vám umožní učiť sa pri tvorbe, čo je overený spôsob, ako si nové zručnosti udržať. **✍️ Srdečné poďakovanie našim autorom** Jen Looper, Stephen Howell, Francesca Lazzeri, Tomomi Imura, Cassie Breviu, Dmitry Soshnikov, Chris Noring, Anirban Mukherjee, Ornella Altunyan, Ruth Yakubu a Amy Boyd -**🎨 Poďakovanie tiež našim ilustrátorom** Tomomi Imura, Dasani Madipalli a Jen Looper +**🎨 Ďakujeme tiež našim ilustrátorom** Tomomi Imura, Dasani Madipalli a Jen Looper -**🙏 Špeciálne poďakovanie 🙏 našim autorom, recenzentom a prispievateľom z Microsoft Student Ambassadors**, najmä Rishit Dagli, Muhammad Sakib Khan Inan, Rohan Raj, Alexandru Petrescu, Abhishek Jaiswal, Nawrin Tabassum, Ioan Samuila a Snigdha Agarwal +**🙏 Špeciálne poďakovanie 🙏 našim Microsoft Student Ambassador autorom, recenzentom a prispievateľom obsahu**, hlavne Rishit Dagli, Muhammad Sakib Khan Inan, Rohan Raj, Alexandru Petrescu, Abhishek Jaiswal, Nawrin Tabassum, Ioan Samuila a Snigdha Agarwal -**🤩 Zvláštne poďakovanie Microsoft Student Ambassadors Eric Wanjau, Jasleen Sondhi a Vidushi Gupta za naše lekcie R!** +**🤩 Extra vďaka Microsoft Student Ambassadors Eric Wanjau, Jasleen Sondhi a Vidushi Gupta za naše lekcie R!** # Začíname Postupujte podľa týchto krokov: -1. **Vytvorte si fork repozitára**: Kliknite na tlačidlo „Fork“ v pravom hornom rohu tejto stránky. +1. **Forknite repozitár**: Kliknite na tlačidlo "Fork" v pravom hornom rohu tejto stránky. 2. **Klonujte repozitár**: `git clone https://github.com/microsoft/ML-For-Beginners.git` -> [nájdite všetky ďalšie zdroje pre tento kurz v našej kolekcii Microsoft Learn](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) +> [nájdite všetky doplnkové zdroje pre tento kurz v našej kolekcii Microsoft Learn](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) -> 🔧 **Potrebujete pomoc?** Pozrite si náš [Návod na riešenie problémov](TROUBLESHOOTING.md) pre riešenia bežných problémov s inštaláciou, nastavením a spúšťaním lekcií. +> 🔧 **Potrebujete pomoc?** Skontrolujte náš [Príručka riešenia problémov](TROUBLESHOOTING.md) s riešeniami bežných problémov pri inštalácii, nastavení a spustení lekcií. -**[Študenti](https://aka.ms/student-page)**, používanie tohto učebného plánu spočíva vo forknutí celého repozitára do svojho GitHub účtu a samostatnom alebo skupinovom plnení cvičení: -- Začnite kvízom pred lekciou. -- Prečítajte si lekciu a dokončite aktivity, pri každej kontrole vedomostí sa zastavte a zamyslite. -- Pokúste sa vytvoriť projekty pochopením lekcií namiesto spúšťania riešení; kód riešení je však k dispozícii v priečinkoch `/solution` v každej lekcii orientovanej na projekt. -- Absolvujte test po lekcii. -- Splňte výzvu. -- Dokončite zadanie. -- Po dokončení skupiny lekcií navštívte [Diskusnú dosku](https://github.com/microsoft/ML-For-Beginners/discussions) a „učte sa nahlas“ vyplnením príslušného PAT hodnotiaceho formulára. 'PAT' je Nástroj hodnotenia pokroku, ktorý vyplníte, aby ste si prehĺbili vedomosti. Môžete tiež reagovať na ďalšie PAT, aby sme sa učili spoločne. +**[Študenti](https://aka.ms/student-page)**, na používanie tohto učebného plánu forknete celý repozitár do vlastného GitHub účtu a vyriešte úlohy sami alebo v skupine: -> Na ďalšie štúdium odporúčame sledovať tieto [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/k7o7tg1gp306q4?WT.mc_id=academic-77952-leestott) moduly a vzdelávacie cesty. +- Začnite s kvízom pred prednáškou. +- Prečítajte si prednášku a dokončite aktivity, zastavujte sa a reflektujte pri každej kontrole vedomostí. +- Pokúste sa vytvoriť projekty pochopením lekcií namiesto spúšťania riešenia; kód riešení je však k dispozícii v priečinkoch `/solution` v každej projektovo orientovanej lekcii. +- Urobte kvíz po prednáške. +- Dokončite výzvu. +- Dokončite úlohu. +- Po dokončení skupiny lekcií navštívte [diskusnú tabuľu](https://github.com/microsoft/ML-For-Beginners/discussions) a „učte sa nahlas“ vyplnením príslušnej hodnotiacej rubriky PAT. PAT je nástroj na hodnotenie pokroku, ktorý vyplníte, aby ste prehĺbili učenie. Môžete tiež reagovať na iné PAT, aby sme sa mohli učiť spoločne. -**Učitelia**, pripravili sme [niekoľko odporúčaní](for-teachers.md) na využitie tohto učebného plánu. +> Na ďalšie štúdium odporúčame tieto [Microsoft Learn](https://docs.microsoft.com/en-us/users/jenlooper-2911/collections/k7o7tg1gp306q4?WT.mc_id=academic-77952-leestott) moduly a učebné cesty. + +**Učitelia**, pripravili sme [niekoľko návrhov](for-teachers.md) ako používať tento učebný plán. --- -## Video návody +## Video prechádzky -Niektoré lekcie sú dostupné ako krátke videá. Nájdete ich priamo v lekciách alebo v [playliste ML for Beginners na Microsoft Developer YouTube kanáli](https://aka.ms/ml-beginners-videos) kliknutím na obrázok nižšie. +Niektoré lekcie sú dostupné vo forme krátkych videí. Nájdete ich priamo v lekciách alebo v zozname [ML for Beginners na Microsoft Developer YouTube kanáli](https://aka.ms/ml-beginners-videos) kliknutím na obrázok nižšie. -[![ML for beginners banner](../../translated_images/sk/ml-for-beginners-video-banner.63f694a100034bc6.webp)](https://aka.ms/ml-beginners-videos) +[![ML pre začiatočníkov banner](../../translated_images/sk/ml-for-beginners-video-banner.63f694a100034bc6.webp)](https://aka.ms/ml-beginners-videos) --- @@ -98,98 +99,98 @@ Niektoré lekcie sú dostupné ako krátke videá. Nájdete ich priamo v lekciá [![Promo video](../../images/ml.gif)](https://youtu.be/Tj1XWrDSYJU) -**Gif od** [Mohit Jaisal](https://linkedin.com/in/mohitjaisal) +**GIF od** [Mohit Jaisal](https://linkedin.com/in/mohitjaisal) -> 🎥 Kliknite na obrázok vyššie pre video o projekte a jeho tvorcoch! +> 🎥 Kliknite na obrázok vyššie pre video o projekte a ľuďoch, ktorí ho vytvorili! --- ## Pedagogika -Pri tvorbe tohto učebného plánu sme si vybrali dva pedagogické princípy: zabezpečiť, aby bol **prakticky projektovo orientovaný** a aby obsahoval **časté kvízy**. Okrem toho má tento učebný plán spoločnú **tému**, ktorá mu dodáva súdržnosť. +Pri tvorbe tohto učebného plánu sme zvolili dve pedagogické zásady: zabezpečiť, aby bol praktický a **projektovo orientovaný** a aby obsahoval **časté kvízy**. Okrem toho má tento učebný plán spoločnú **tému** pre jeho jednotnosť. -Zabezpečením súladu obsahu s projektmi je proces pre študentov zaujímavejší a upevňuje sa zapamätanie si konceptov. Nízko-rizikový kvíz pred triedou nastavia zámer študenta naučiť sa tému, zatiaľ čo druhý kvíz po lekcii zabezpečuje ďalšie upevnenie vedomostí. Tento učebný plán je navrhnutý tak, aby bol flexibilný a zábavný, a možno ho absolvovať celý alebo čiastočne. Projekty začínajú malé a do konca 12-týždňového cyklu získavajú zložitosť. Učebný plán tiež obsahuje pospis o praktických využitiach ML, ktorý možno použiť ako extra kredit alebo ako základ diskusie. +Zaradenie obsahu zameraného na projekty robí proces zaujímavejším pre študentov a podporuje lepšie udržanie konceptov. Nízko-nákladový kvíz pred prednáškou nastavuje študentovi zámer naučiť sa tému, zatiaľ čo ďalší kvíz po prednáške podporuje ešte lepšie zapamätanie. Tento učebný plán je navrhnutý ako flexibilný a zábavný a môže byť absolvovaný celý alebo po častiach. Projekty začínajú malé a postupne sa zložitosť zvyšuje počas 12-týždňového cyklu. Učebný plán tiež obsahuje pospis na praktické použitie ML, ktorý možno použiť ako doplňujúcu záťaž alebo ako základ pre diskusiu. -> Nájdete tu naše [Pravidlá správania](CODE_OF_CONDUCT.md), [Príspevky](CONTRIBUTING.md), [Preklady](..) a [Návody na riešenie problémov](TROUBLESHOOTING.md). Radi prijmeme vašu konštruktívnu spätnú väzbu! +> Nájdete u nás [Kódex správania](CODE_OF_CONDUCT.md), [Príspevky](CONTRIBUTING.md), [Preklady](..) a [Riešenie problémov](TROUBLESHOOTING.md). Vaše konštruktívne pripomienky vítame! ## Každá lekcia obsahuje -- voliteľnú skicu poznámok +- voliteľnú náčrtovú poznámku - voliteľné doplnkové video -- video návod (len niektoré lekcie) -- [kvíz na rozcvičenie pred lekciou](https://ff-quizzes.netlify.app/en/ml/) +- video prechádzku (len niektoré lekcie) +- [kvíz na zahriatie pred prednáškou](https://ff-quizzes.netlify.app/en/ml/) - písomnú lekciu -- pre projektové lekcie, krok za krokom návody na vybudovanie projektu +- pre projektovo orientované lekcie, krok za krokom návody na vytvorenie projektu - kontroly vedomostí - výzvu - doplnkové čítanie -- zadanie -- [kvíz po lekcii](https://ff-quizzes.netlify.app/en/ml/) -> **Poznámka o jazykoch**: Tieto lekcie sú primárne napísané v Pythone, ale mnohé sú dostupné aj v R. Ak chcete dokončiť lekciu v R, prejdite do priečinka `/solution` a vyhľadajte lekcie v R. Obsahujú príponu .rmd, ktorá predstavuje **R Markdown** súbor, čo možno jednoducho definovať ako vkladanie `kódových blokov` (v R alebo iných jazykoch) a `YAML hlavičky` (ktorá usmerňuje, ako formátovať výstupy, napr. PDF) v `Markdown dokumente`. Takto slúži ako príkladný rámec pre tvorbu dokumentov v dátovej vede, pretože vám umožňuje kombinovať váš kód, jeho výstup a vaše poznámky tým, že ich môžete zaznamenať v Markdown. Navyše, dokumenty R Markdown môžu byť vyrenderované do výstupných formátov ako PDF, HTML alebo Word. - -> **Poznámka o kvízoch**: Všetky kvízy sú uložené v [priečinku Quiz App](../../quiz-app), celkovo 52 kvízov so štruktúrou troch otázok každý. Sú prepojené v jednotlivých lekciách, ale aplikáciu na kvízy možno spustiť lokálne; postupujte podľa inštrukcií v priečinku `quiz-app` pre lokálne hosťovanie alebo nasadenie do Azure. - -| Číslo lekcie | Téma | Zoskupenie lekcie | Ciele učenia | Prepojená lekcia | Autor | -| :----------: | :------------------------------------------------------------: | :------------------------------------------------: | ----------------------------------------------------------------------------------------------------------------------------- | :---------------------------------------------------------------------------------------------------------------------------------------------: | :--------------------------------------------: | -| 01 | Úvod do strojového učenia | [Úvod](1-Introduction/README.md) | Naučte sa základné pojmy strojového učenia | [Lekcia](1-Introduction/1-intro-to-ML/README.md) | Muhammad | -| 02 | História strojového učenia | [Úvod](1-Introduction/README.md) | Spoznajte históriu tohto odboru | [Lekcia](1-Introduction/2-history-of-ML/README.md) | Jen a Amy | -| 03 | Spravodlivosť a strojové učenie | [Úvod](1-Introduction/README.md) | Aké sú dôležité filozofické otázky spravodlivosti, ktoré by študenti mali zvážiť pri vývoji a použití ML modelov? | [Lekcia](1-Introduction/3-fairness/README.md) | Tomomi | -| 04 | Techniky strojového učenia | [Úvod](1-Introduction/README.md) | Aké techniky používajú výskumníci ML na tvorbu modelov? | [Lekcia](1-Introduction/4-techniques-of-ML/README.md) | Chris a Jen | -| 05 | Úvod do regresie | [Regresia](2-Regression/README.md) | Začnite s Pythonom a Scikit-learn pre regresné modely | [Python](2-Regression/1-Tools/README.md) • [R](../../2-Regression/1-Tools/solution/R/lesson_1.html) | Jen • Eric Wanjau | -| 06 | Ceny tekvíc v Severnej Amerike 🎃 | [Regresia](2-Regression/README.md) | Vizualizujte a očistite dáta na prípravu ML | [Python](2-Regression/2-Data/README.md) • [R](../../2-Regression/2-Data/solution/R/lesson_2.html) | Jen • Eric Wanjau | -| 07 | Ceny tekvíc v Severnej Amerike 🎃 | [Regresia](2-Regression/README.md) | Postavte lineárne a polynomiálne regresné modely | [Python](2-Regression/3-Linear/README.md) • [R](../../2-Regression/3-Linear/solution/R/lesson_3.html) | Jen a Dmitry • Eric Wanjau | -| 08 | Ceny tekvíc v Severnej Amerike 🎃 | [Regresia](2-Regression/README.md) | Vybudujte logistický regresný model | [Python](2-Regression/4-Logistic/README.md) • [R](../../2-Regression/4-Logistic/solution/R/lesson_4.html) | Jen • Eric Wanjau | -| 09 | Webová aplikácia 🔌 | [Web App](3-Web-App/README.md) | Vybudujte webovú aplikáciu na použitie vášho natrénovaného modelu | [Python](3-Web-App/1-Web-App/README.md) | Jen | -| 10 | Úvod do klasifikácie | [Klasifikácia](4-Classification/README.md) | Očistite, pripravte a vizualizujte svoje dáta; úvod do klasifikácie | [Python](4-Classification/1-Introduction/README.md) • [R](../../4-Classification/1-Introduction/solution/R/lesson_10.html) | Jen a Cassie • Eric Wanjau | -| 11 | Lahodné ázijské a indické kuchyne 🍜 | [Klasifikácia](4-Classification/README.md) | Úvod do klasifikátorov | [Python](4-Classification/2-Classifiers-1/README.md) • [R](../../4-Classification/2-Classifiers-1/solution/R/lesson_11.html) | Jen a Cassie • Eric Wanjau | -| 12 | Lahodné ázijské a indické kuchyne 🍜 | [Klasifikácia](4-Classification/README.md) | Viac klasifikátorov | [Python](4-Classification/3-Classifiers-2/README.md) • [R](../../4-Classification/3-Classifiers-2/solution/R/lesson_12.html) | Jen a Cassie • Eric Wanjau | -| 13 | Lahodné ázijské a indické kuchyne 🍜 | [Klasifikácia](4-Classification/README.md) | Postavte odporúčaciu webovú aplikáciu pomocou vášho modelu | [Python](4-Classification/4-Applied/README.md) | Jen | -| 14 | Úvod do zhlukovania | [Zhlukovanie](5-Clustering/README.md) | Očistite, pripravte a vizualizujte svoje dáta; úvod do zhlukovania | [Python](5-Clustering/1-Visualize/README.md) • [R](../../5-Clustering/1-Visualize/solution/R/lesson_14.html) | Jen • Eric Wanjau | -| 15 | Preskúmanie nigerijských hudobných chutí 🎧 | [Zhlukovanie](5-Clustering/README.md) | Preskúmajte K-Means zhlukovaciu metódu | [Python](5-Clustering/2-K-Means/README.md) • [R](../../5-Clustering/2-K-Means/solution/R/lesson_15.html) | Jen • Eric Wanjau | -| 16 | Úvod do spracovania prirodzeného jazyka ☕️ | [Spracovanie prirodzeného jazyka](6-NLP/README.md) | Naučte sa základy NLP vytvorením jednoduchého bota | [Python](6-NLP/1-Introduction-to-NLP/README.md) | Stephen | -| 17 | Bežné úlohy NLP ☕️ | [Spracovanie prirodzeného jazyka](6-NLP/README.md) | Prehĺbte svoje poznatky o NLP pochopením bežných úloh pri práci s jazykovými štruktúrami | [Python](6-NLP/2-Tasks/README.md) | Stephen | -| 18 | Preklad a analýza sentimentu ♥️ | [Spracovanie prirodzeného jazyka](6-NLP/README.md) | Preklad a analýza sentimentu s Jane Austen | [Python](6-NLP/3-Translation-Sentiment/README.md) | Stephen | -| 19 | Romantické hotely v Európe ♥️ | [Spracovanie prirodzeného jazyka](6-NLP/README.md) | Sentimentálna analýza s hotelovými recenziami 1 | [Python](6-NLP/4-Hotel-Reviews-1/README.md) | Stephen | -| 20 | Romantické hotely v Európe ♥️ | [Spracovanie prirodzeného jazyka](6-NLP/README.md) | Sentimentálna analýza s hotelovými recenziami 2 | [Python](6-NLP/5-Hotel-Reviews-2/README.md) | Stephen | -| 21 | Úvod do predikcie časových radov | [Časové rady](7-TimeSeries/README.md) | Úvod do predikcie časových radov | [Python](7-TimeSeries/1-Introduction/README.md) | Francesca | -| 22 | ⚡️ Svetová spotreba energie ⚡️ - predikcia časových radov pomocou ARIMA | [Časové rady](7-TimeSeries/README.md) | Predikcia časových radov pomocou ARIMA | [Python](7-TimeSeries/2-ARIMA/README.md) | Francesca | -| 23 | ⚡️ Svetová spotreba energie ⚡️ - predikcia časových radov pomocou SVR | [Časové rady](7-TimeSeries/README.md) | Predikcia časových radov pomocou Support Vector Regressora | [Python](7-TimeSeries/3-SVR/README.md) | Anirban | -| 24 | Úvod do posilňovacieho učenia | [Posilňovacie učenie](8-Reinforcement/README.md) | Úvod do posilňovacieho učenia pomocou Q-Learning | [Python](8-Reinforcement/1-QLearning/README.md) | Dmitry | -| 25 | Pomôžte Petrovi vyhnúť sa vlkovi! 🐺 | [Posilňovacie učenie](8-Reinforcement/README.md) | Posilňovacie učenie pomocou Gym | [Python](8-Reinforcement/2-Gym/README.md) | Dmitry | -| Postscript | Skutočné scenáre a aplikácie ML | [ML vo svete](9-Real-World/README.md) | Zaujímavé a odhaľujúce reálne aplikácie klasického ML | [Lekcia](9-Real-World/1-Applications/README.md) | Tím | -| Postscript | Ladenie modelov ML pomocou RAI dashboardu | [ML vo svete](9-Real-World/README.md) | Ladenie modelov v strojovom učení pomocou komponentov Responsible AI dashboardu | [Lekcia](9-Real-World/2-Debugging-ML-Models/README.md) | Ruth Yakubu | - -> [nájdite všetky ďalšie materiály k tomuto kurzu v našej kolekcii Microsoft Learn](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) - -## Prístup offline - -Túto dokumentáciu môžete používať offline pomocou [Docsify](https://docsify.js.org/#/). Naklonujte si tento repozitár, [nainštalujte Docsify](https://docsify.js.org/#/quickstart) na svoj lokálny počítač a potom v koreňovom priečinku repozitára spustite príkaz `docsify serve`. Webstránka bude sprístupnená na porte 3000 na vašom localhoste: `localhost:3000`. - -## PDF súbory - -Nájdite pdf učebného plánu s odkazmi [tu](https://microsoft.github.io/ML-For-Beginners/pdf/readme.pdf). +- úlohu +- [kvíz po prednáške](https://ff-quizzes.netlify.app/en/ml/) +> **Poznámka o jazykoch**: Tieto lekcie sú primárne napísané v Pythone, ale mnohé sú dostupné aj v jazyku R. Ak chcete dokončiť lekciu R, choďte do priečinka `/solution` a vyhľadajte lekcie v R. Tieto obsahujú príponu .rmd, čo predstavuje **R Markdown** súbor, ktorý možno jednoducho definovať ako vloženie `kódových blokov` (v R alebo iných jazykoch) a `YAML hlavičky` (ktorá riadi formátovanie výstupov, napríklad PDF) do `Markdown dokumentu`. Ako také slúži ako vzorový autorský rámec pre dátovú vedu, pretože vám umožňuje skombinovať váš kód, jeho výstupy a vaše myšlienky tým, že ich môžete zapisovať v Markdown formáte. Navyše, dokumenty R Markdown je možné zobrazovať do formátov výstupu ako PDF, HTML alebo Word. + +> **Poznámka o kvízoch**: Všetky kvízy sú obsiahnuté v [Quiz App folder](../../quiz-app), celkovo 52 kvízov so štyrmi otázkami každý. Sú prepojené z lekcií, ale túto aplikáciu kvízov je možné spustiť lokálne; riaďte sa inštrukciami v priečinku `quiz-app` pre lokálne hosťovanie alebo nasadenie na Azure. + +| Číslo lekcie | Téma | Skupina lekcie | Učiace sa ciele | Prepojené lekcie | Autor | +| :----------: | :-----------------------------------------------------------: | :------------------------------------------------: | ------------------------------------------------------------------------------------------------------------------------------ | :--------------------------------------------------------------------------------------------------------------------------------------: | :------------------------------------------------: | +| 01 | Úvod do strojového učenia | [Úvod](1-Introduction/README.md) | Naučiť sa základné pojmy strojového učenia | [Lekcia](1-Introduction/1-intro-to-ML/README.md) | Muhammad | +| 02 | História strojového učenia | [Úvod](1-Introduction/README.md) | Naučiť sa históriu tohto odboru | [Lekcia](1-Introduction/2-history-of-ML/README.md) | Jen and Amy | +| 03 | Spravodlivosť a strojové učenie | [Úvod](1-Introduction/README.md) | Aké sú dôležité filozofické otázky o spravodlivosti, ktoré by študenti mali zvážiť pri budovaní a aplikovaní ML modelov? | [Lekcia](1-Introduction/3-fairness/README.md) | Tomomi | +| 04 | Techniky strojového učenia | [Úvod](1-Introduction/README.md) | Aké techniky používajú výskumníci ML na budovanie modelov? | [Lekcia](1-Introduction/4-techniques-of-ML/README.md) | Chris and Jen | +| 05 | Úvod do regresie | [Regresia](2-Regression/README.md) | Začať s Pythonom a Scikit-learn pre regresné modely | [Python](2-Regression/1-Tools/README.md) • [R](../../2-Regression/1-Tools/solution/R/lesson_1.html) | Jen • Eric Wanjau | +| 06 | Ceny tekvíc v Severnej Amerike 🎃 | [Regresia](2-Regression/README.md) | Vizualizovať a vyčistiť dáta na prípravu pre ML | [Python](2-Regression/2-Data/README.md) • [R](../../2-Regression/2-Data/solution/R/lesson_2.html) | Jen • Eric Wanjau | +| 07 | Ceny tekvíc v Severnej Amerike 🎃 | [Regresia](2-Regression/README.md) | Stavať lineárne a polynomiálne regresné modely | [Python](2-Regression/3-Linear/README.md) • [R](../../2-Regression/3-Linear/solution/R/lesson_3.html) | Jen and Dmitry • Eric Wanjau | +| 08 | Ceny tekvíc v Severnej Amerike 🎃 | [Regresia](2-Regression/README.md) | Vytvárať logistický regresný model | [Python](2-Regression/4-Logistic/README.md) • [R](../../2-Regression/4-Logistic/solution/R/lesson_4.html) | Jen • Eric Wanjau | +| 09 | Webová aplikácia 🔌 | [Web App](3-Web-App/README.md) | Vytvoriť webovú aplikáciu na použitie vášho vycvičeného modelu | [Python](3-Web-App/1-Web-App/README.md) | Jen | +| 10 | Úvod do klasifikácie | [Klasifikácia](4-Classification/README.md) | Vyčistiť, pripraviť a vizualizovať dáta; úvod do klasifikácie | [Python](4-Classification/1-Introduction/README.md) • [R](../../4-Classification/1-Introduction/solution/R/lesson_10.html) | Jen and Cassie • Eric Wanjau | +| 11 | Lahodné ázijské a indické kuchyne 🍜 | [Klasifikácia](4-Classification/README.md) | Úvod do klasifikátorov | [Python](4-Classification/2-Classifiers-1/README.md) • [R](../../4-Classification/2-Classifiers-1/solution/R/lesson_11.html) | Jen and Cassie • Eric Wanjau | +| 12 | Lahodné ázijské a indické kuchyne 🍜 | [Klasifikácia](4-Classification/README.md) | Viac klasifikátorov | [Python](4-Classification/3-Classifiers-2/README.md) • [R](../../4-Classification/3-Classifiers-2/solution/R/lesson_12.html) | Jen and Cassie • Eric Wanjau | +| 13 | Lahodné ázijské a indické kuchyne 🍜 | [Klasifikácia](4-Classification/README.md) | Vytvoriť odporúčaciu webovú aplikáciu s použitím vášho modelu | [Python](4-Classification/4-Applied/README.md) | Jen | +| 14 | Úvod do zhlukovania | [Zhlukovanie](5-Clustering/README.md) | Vyčistiť, pripraviť a vizualizovať dáta; Úvod do zhlukovania | [Python](5-Clustering/1-Visualize/README.md) • [R](../../5-Clustering/1-Visualize/solution/R/lesson_14.html) | Jen • Eric Wanjau | +| 15 | Preskúmanie nigerijských hudobných chutí 🎧 | [Zhlukovanie](5-Clustering/README.md) | Preskúmať metódu K-Means zhlukovania | [Python](5-Clustering/2-K-Means/README.md) • [R](../../5-Clustering/2-K-Means/solution/R/lesson_15.html) | Jen • Eric Wanjau | +| 16 | Úvod do spracovania prirodzeného jazyka ☕️ | [Spracovanie natural language](6-NLP/README.md) | Naučiť sa základy NLP vytvorením jednoduchého bota | [Python](6-NLP/1-Introduction-to-NLP/README.md) | Stephen | +| 17 | Bežné úlohy NLP ☕️ | [Spracovanie natural language](6-NLP/README.md) | Prehĺbiť svoje vedomosti o NLP pochopením bežných úloh pri práci s jazykovými štruktúrami | [Python](6-NLP/2-Tasks/README.md) | Stephen | +| 18 | Preklad a analýza sentimentu ♥️ | [Spracovanie natural language](6-NLP/README.md) | Preklad a analýza sentimentu s Jane Austen | [Python](6-NLP/3-Translation-Sentiment/README.md) | Stephen | +| 19 | Romantické hotely v Európe ♥️ | [Spracovanie natural language](6-NLP/README.md) | Analýza sentimentu na základe hotelových recenzií 1 | [Python](6-NLP/4-Hotel-Reviews-1/README.md) | Stephen | +| 20 | Romantické hotely v Európe ♥️ | [Spracovanie natural language](6-NLP/README.md) | Analýza sentimentu na základe hotelových recenzií 2 | [Python](6-NLP/5-Hotel-Reviews-2/README.md) | Stephen | +| 21 | Úvod do prognózovania časových radov | [Časové rady](7-TimeSeries/README.md) | Úvod do prognózovania časových radov | [Python](7-TimeSeries/1-Introduction/README.md) | Francesca | +| 22 | ⚡️ Svetová spotreba energie ⚡️ - prognózovanie časových radov s ARIMA | [Časové rady](7-TimeSeries/README.md) | Prognózovanie časových radov pomocou ARIMA | [Python](7-TimeSeries/2-ARIMA/README.md) | Francesca | +| 23 | ⚡️ Svetová spotreba energie ⚡️ - prognózovanie časových radov so SVR | [Časové rady](7-TimeSeries/README.md) | Prognózovanie časových radov so Support Vector Regressor | [Python](7-TimeSeries/3-SVR/README.md) | Anirban | +| 24 | Úvod do posilňovacieho učenia | [Posilňovacie učenie](8-Reinforcement/README.md) | Úvod do posilňovacieho učenia pomocou Q-Learning | [Python](8-Reinforcement/1-QLearning/README.md) | Dmitry | +| 25 | Pomôž Petrovi vyhnúť sa vlkovi! 🐺 | [Posilňovacie učenie](8-Reinforcement/README.md) | Posilňovacie učenie Gym | [Python](8-Reinforcement/2-Gym/README.md) | Dmitry | +| Postscript | Skutočné scenáre a aplikácie ML | [ML v praxi](9-Real-World/README.md) | Zaujímavé a poučné reálne aplikácie klasického ML | [Lekcia](9-Real-World/1-Applications/README.md) | Tím | +| Postscript | Ladenie modelov ML pomocou RAI dashboardu | [ML v praxi](9-Real-World/README.md) | Ladenie modelov strojového učenia pomocou komponentov dashboardu Responsible AI | [Lekcia](9-Real-World/2-Debugging-ML-Models/README.md) | Ruth Yakubu | + +> [nájdite všetky doplnkové zdroje pre tento kurz v našej Microsoft Learn kolekcii](https://learn.microsoft.com/en-us/collections/qrqzamz1nn2wx3?WT.mc_id=academic-77952-bethanycheum) + +## Offline prístup + +Túto dokumentáciu môžete spustiť offline pomocou [Docsify](https://docsify.js.org/#/). Vytvorte si forka tohto repozitára, [nainštalujte Docsify](https://docsify.js.org/#/quickstart) na váš lokálny počítač a potom v koreňovom priečinku tohto repozitára zadajte príkaz `docsify serve`. Webová stránka bude sprístupnená na porte 3000 na vašom localhoste: `localhost:3000`. + +## PDF + +Nájdite PDF s osnovou a odkazmi [tu](https://microsoft.github.io/ML-For-Beginners/pdf/readme.pdf). ## 🎒 Ďalšie kurzy -Náš tím vytvára aj iné kurzy! Pozrite si: +Náš tím vytvára aj ďalšie kurzy! Pozrite si: ### LangChain -[![LangChain4j pre začiatočníkov](https://img.shields.io/badge/LangChain4j%20for%20Beginners-22C55E?style=for-the-badge&&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchain4j-for-beginners) -[![LangChain.js pre začiatočníkov](https://img.shields.io/badge/LangChain.js%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchainjs-for-beginners?WT.mc_id=m365-94501-dwahlin) -[![LangChain pre začiatočníkov](https://img.shields.io/badge/LangChain%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://github.com/microsoft/langchain-for-beginners?WT.mc_id=m365-94501-dwahlin) +[![LangChain4j for Beginners](https://img.shields.io/badge/LangChain4j%20for%20Beginners-22C55E?style=for-the-badge&&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchain4j-for-beginners) +[![LangChain.js for Beginners](https://img.shields.io/badge/LangChain.js%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://aka.ms/langchainjs-for-beginners?WT.mc_id=m365-94501-dwahlin) +[![LangChain for Beginners](https://img.shields.io/badge/LangChain%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=0553D6)](https://github.com/microsoft/langchain-for-beginners?WT.mc_id=m365-94501-dwahlin) --- -### Azure / Edge / MCP / Agentov -[![AZD pre začiatočníkov](https://img.shields.io/badge/AZD%20for%20Beginners-0078D4?style=for-the-badge&labelColor=E5E7EB&color=0078D4)](https://github.com/microsoft/AZD-for-beginners?WT.mc_id=academic-105485-koreyst) -[![Edge AI pre začiatočníkov](https://img.shields.io/badge/Edge%20AI%20for%20Beginners-00B8E4?style=for-the-badge&labelColor=E5E7EB&color=00B8E4)](https://github.com/microsoft/edgeai-for-beginners?WT.mc_id=academic-105485-koreyst) +### Azure / Edge / MCP / Agents +[![AZD for Beginners](https://img.shields.io/badge/AZD%20for%20Beginners-0078D4?style=for-the-badge&labelColor=E5E7EB&color=0078D4)](https://github.com/microsoft/AZD-for-beginners?WT.mc_id=academic-105485-koreyst) +[![Edge AI for Beginners](https://img.shields.io/badge/Edge%20AI%20for%20Beginners-00B8E4?style=for-the-badge&labelColor=E5E7EB&color=00B8E4)](https://github.com/microsoft/edgeai-for-beginners?WT.mc_id=academic-105485-koreyst) [![MCP pre začiatočníkov](https://img.shields.io/badge/MCP%20for%20Beginners-009688?style=for-the-badge&labelColor=E5E7EB&color=009688)](https://github.com/microsoft/mcp-for-beginners?WT.mc_id=academic-105485-koreyst) -[![AI Agenti pre začiatočníkov](https://img.shields.io/badge/AI%20Agents%20for%20Beginners-00C49A?style=for-the-badge&labelColor=E5E7EB&color=00C49A)](https://github.com/microsoft/ai-agents-for-beginners?WT.mc_id=academic-105485-koreyst) +[![AI agenti pre začiatočníkov](https://img.shields.io/badge/AI%20Agents%20for%20Beginners-00C49A?style=for-the-badge&labelColor=E5E7EB&color=00C49A)](https://github.com/microsoft/ai-agents-for-beginners?WT.mc_id=academic-105485-koreyst) --- -### Séria Generatívnej AI +### Séria Generatívna AI [![Generatívna AI pre začiatočníkov](https://img.shields.io/badge/Generative%20AI%20for%20Beginners-8B5CF6?style=for-the-badge&labelColor=E5E7EB&color=8B5CF6)](https://github.com/microsoft/generative-ai-for-beginners?WT.mc_id=academic-105485-koreyst) [![Generatívna AI (.NET)](https://img.shields.io/badge/Generative%20AI%20(.NET)-9333EA?style=for-the-badge&labelColor=E5E7EB&color=9333EA)](https://github.com/microsoft/Generative-AI-for-beginners-dotnet?WT.mc_id=academic-105485-koreyst) [![Generatívna AI (Java)](https://img.shields.io/badge/Generative%20AI%20(Java)-C084FC?style=for-the-badge&labelColor=E5E7EB&color=C084FC)](https://github.com/microsoft/generative-ai-for-beginners-java?WT.mc_id=academic-105485-koreyst) @@ -198,40 +199,51 @@ Náš tím vytvára aj iné kurzy! Pozrite si: --- ### Základné učenie -[![Strojové učenie pre začiatočníkov](https://img.shields.io/badge/ML%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=22C55E)](https://aka.ms/ml-beginners?WT.mc_id=academic-105485-koreyst) -[![Dátová veda pre začiatočníkov](https://img.shields.io/badge/Data%20Science%20for%20Beginners-84CC16?style=for-the-badge&labelColor=E5E7EB&color=84CC16)](https://aka.ms/datascience-beginners?WT.mc_id=academic-105485-koreyst) +[![ML pre začiatočníkov](https://img.shields.io/badge/ML%20for%20Beginners-22C55E?style=for-the-badge&labelColor=E5E7EB&color=22C55E)](https://aka.ms/ml-beginners?WT.mc_id=academic-105485-koreyst) +[![Dáta veda pre začiatočníkov](https://img.shields.io/badge/Data%20Science%20for%20Beginners-84CC16?style=for-the-badge&labelColor=E5E7EB&color=84CC16)](https://aka.ms/datascience-beginners?WT.mc_id=academic-105485-koreyst) [![AI pre začiatočníkov](https://img.shields.io/badge/AI%20for%20Beginners-A3E635?style=for-the-badge&labelColor=E5E7EB&color=A3E635)](https://aka.ms/ai-beginners?WT.mc_id=academic-105485-koreyst) -[![Kyberbezpečnosť pre začiatočníkov](https://img.shields.io/badge/Cybersecurity%20for%20Beginners-F97316?style=for-the-badge&labelColor=E5E7EB&color=F97316)](https://github.com/microsoft/Security-101?WT.mc_id=academic-96948-sayoung) -[![Webový vývoj pre začiatočníkov](https://img.shields.io/badge/Web%20Dev%20for%20Beginners-EC4899?style=for-the-badge&labelColor=E5E7EB&color=EC4899)](https://aka.ms/webdev-beginners?WT.mc_id=academic-105485-koreyst) +[![Kybernetická bezpečnosť pre začiatočníkov](https://img.shields.io/badge/Cybersecurity%20for%20Beginners-F97316?style=for-the-badge&labelColor=E5E7EB&color=F97316)](https://github.com/microsoft/Security-101?WT.mc_id=academic-96948-sayoung) +[![Web vývoj pre začiatočníkov](https://img.shields.io/badge/Web%20Dev%20for%20Beginners-EC4899?style=for-the-badge&labelColor=E5E7EB&color=EC4899)](https://aka.ms/webdev-beginners?WT.mc_id=academic-105485-koreyst) [![IoT pre začiatočníkov](https://img.shields.io/badge/IoT%20for%20Beginners-14B8A6?style=for-the-badge&labelColor=E5E7EB&color=14B8A6)](https://aka.ms/iot-beginners?WT.mc_id=academic-105485-koreyst) [![XR vývoj pre začiatočníkov](https://img.shields.io/badge/XR%20Development%20for%20Beginners-38BDF8?style=for-the-badge&labelColor=E5E7EB&color=38BDF8)](https://github.com/microsoft/xr-development-for-beginners?WT.mc_id=academic-105485-koreyst) --- ### Séria Copilot -[![Copilot pre AI párované programovanie](https://img.shields.io/badge/Copilot%20for%20AI%20Paired%20Programming-FACC15?style=for-the-badge&labelColor=E5E7EB&color=FACC15)](https://aka.ms/GitHubCopilotAI?WT.mc_id=academic-105485-koreyst) +[![Copilot pre programovanie v páre s AI](https://img.shields.io/badge/Copilot%20for%20AI%20Paired%20Programming-FACC15?style=for-the-badge&labelColor=E5E7EB&color=FACC15)](https://aka.ms/GitHubCopilotAI?WT.mc_id=academic-105485-koreyst) [![Copilot pre C#/.NET](https://img.shields.io/badge/Copilot%20for%20C%23/.NET-FBBF24?style=for-the-badge&labelColor=E5E7EB&color=FBBF24)](https://github.com/microsoft/mastering-github-copilot-for-dotnet-csharp-developers?WT.mc_id=academic-105485-koreyst) -[![Copilot Dobrodružstvo](https://img.shields.io/badge/Copilot%20Adventure-FDE68A?style=for-the-badge&labelColor=E5E7EB&color=FDE68A)](https://github.com/microsoft/CopilotAdventures?WT.mc_id=academic-105485-koreyst) +[![Copilot dobrodružstvo](https://img.shields.io/badge/Copilot%20Adventure-FDE68A?style=for-the-badge&labelColor=E5E7EB&color=FDE68A)](https://github.com/microsoft/CopilotAdventures?WT.mc_id=academic-105485-koreyst) ## Získanie pomoci -Ak uviaznete alebo máte akékoľvek otázky týkajúce sa tvorby AI aplikácií, pripojte sa k ostatným študentom a skúseným vývojárom v diskusiách o MCP. Je to podporujúca komunita, kde sú otázky vítané a poznatky sa zdieľajú slobodne. +Ak sa zaseknete alebo máte otázky počas učenia strojového učenia alebo vývoja AI aplikácií, nebojte sa — pomoc je k dispozícii. -[![Microsoft Foundry Discord](https://dcbadge.limes.pink/api/server/nTYy5BXMWG)](https://discord.gg/nTYy5BXMWG) +Môžete sa pripojiť k diskusiám s ostatnými študentmi a vývojármi, klásť otázky a zdieľať svoje nápady s komunitou. + +- Pripojte sa k komunite, aby ste kládli otázky a učili sa s ostatnými +- Diskutujte o konceptoch strojového učenia a nápadoch na projekty +- Získajte usmernenie od skúsených vývojárov + +Podporná komunita je skvelý spôsob, ako rozvíjať svoje zručnosti a rýchlejšie riešiť problémy. -Ak máte spätnú väzbu na produkt alebo narazíte na chyby počas tvorby, navštívte: +[Microsoft Foundry Discord komunita](https://discord.gg/nTYy5BXMWG) + +Ak narazíte na chyby, problémy alebo máte návrhy na vylepšenia, môžete tiež otvoriť **Issue** v tomto repozitári a nahlásiť problém. + +Pre spätnú väzbu k produktu alebo pre vyhľadávanie existujúcich príspevkov v komunite navštívte Vývojárske fórum: [![Microsoft Foundry Developer Forum](https://img.shields.io/badge/GitHub-Microsoft_Foundry_Developer_Forum-blue?style=for-the-badge&logo=github&color=000000&logoColor=fff)](https://aka.ms/foundry/forum) -## Dodatočné tipy na učenie -- Po každej lekcii si prezrite poznámkové bloky pre lepšie pochopenie. +## Ďalšie tipy na učenie + +- Prejdite si poznámkové bloky po každej lekcii pre lepšie porozumenie. - Precvičujte implementáciu algoritmov samostatne. -- Preskúmajte reálne dátové súbory využitím naučených konceptov. +- Preskúmajte reálne datasety pomocou naučených konceptov. --- **Zrieknutie sa zodpovednosti**: -Tento dokument bol preložený pomocou AI prekladateľskej služby [Co-op Translator](https://github.com/Azure/co-op-translator). Aj keď sa snažíme o presnosť, prosím, berte na vedomie, že automatizované preklady môžu obsahovať chyby alebo nepresnosti. Originálny dokument v jeho pôvodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie odporúčame profesionálny ľudský preklad. Nie sme zodpovední za akékoľvek nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu. +Tento dokument bol preložený pomocou AI prekladateľskej služby [Co-op Translator](https://github.com/Azure/co-op-translator). Aj keď sa snažíme o presnosť, prosím, majte na pamäti, že automatizované preklady môžu obsahovať chyby alebo nepresnosti. Pôvodný dokument v jeho rodnom jazyku by mal byť považovaný za autoritatívny zdroj. Pre kritické informácie sa odporúča profesionálny ľudský preklad. Nenesieme zodpovednosť za akékoľvek nedorozumenia alebo nesprávne interpretácie vyplývajúce z použitia tohto prekladu. \ No newline at end of file